Создадим: статьи и новости по теме

03.11.2022

Как создать и удалить таблицы в Apache Hadoop c использованием PySpark

Сегодня я расскажу, как затратив минимум усилий при работе с большими данными, справиться с задачей создания таблиц с нужными параметрами, а также, как удалить сразу большое количество потерявших актуальность таблиц.

NTA

23.03.2022

Использование алгоритма COPOD для поиска аномалий

С каждым годом data driven подход становится все более популярным. Объем данных увеличивается вместе с потребностью извлечения полезной информации из бесконечного потока данных. Передовые компании мира все чаще используют машинное обучение для обнаружения инсайтов и аномалий в больших данных.

NTA

30.03.2020

Три шага для экспресс-обработки и разметки текста

Рассмотрим стандартную ситуацию, когда надо сделать и обработать подборку негатива СМИ по контрагентам. Если эта задача разовая, количество контрагентов не велико и анализируемый период достаточно короткий, то не стоит нагружать себя и готовить автоматизированное решение не имеет смысла. Поэтому данная информация будет интересна тем, кто планирует…

Создадим

Как создать и удалить таблицы в Apache Hadoop c использованием PySpark

Использование алгоритма COPOD для поиска аномалий

Три шага для экспресс-обработки и разметки текста​

Три шага для экспресс-обработки и разметки текста