{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

Поиск аномалий в потоках данных: что дает бизнесу внедрение системы мониторинга на базе машинного обучения

Частая причина финансовых потерь бизнеса — использование решений, основанных на некорректных данных, или бездействие персонала при возникновении аномалий.

Зачастую убытки происходят из-за ряда факторов:

  • Большое количество данных (структурированных и неструктурированных) и их непрерывный рост.
  • Сложность обработки информации в режиме реального времени. Если потоковые данные напрямую взаимосвязаны с текущими бизнес-процессами, ошибка в них может привести к существенным просчетам.
  • Изменчивость информации, которая может корректироваться под воздействием естественных факторов.
  • Трудоемкость переработки правил в случае корректировки исходных данных.
  • Сложность создания проверок, для которых требуются экспертные знания.
  • Большое разнообразие баз данных (PostgreSQL, Hive, Kafka и т. д.).

Чтобы справиться со всеми вышеперечисленными сложностями и обеспечить необходимый уровень качества данных, предприятию необходим инструментарий, способный автоматизировать процессы и беспрерывно мониторить постоянно растущий объем информации. На примере системы Almaz Monitoring рассказываем, как решаются эти проблемы и что получает заказчик от использования такого инструмента.

Стандартный подход

Преимущественно контроль качества данных ассоциируется с четкими правилами (поле X больше поля Y, отсутствие пустых данных, проверка на диапазоны), которые реализуются через pushdown SQL-запросы. Такой подход хоть и считается простым, точным и легко интерпретируемым, но содержит ряд неудобств.

Цифровизация бизнеса растет с большой скоростью, и вместе с ней увеличивается количество данных. Повсеместное внедрение ML-моделей также генерирует огромный объем информации, от качества которой зависят важные процессы бизнеса.

Для проверки SQL-запросов требуется предварительный анализ данных, написание и оптимизация процесса обработки информации, а также ресурсы для дальнейшей работы с аналитикой. При этом всегда можно попасть в ситуацию, когда для осуществления проверки понадобится большой кластер или дополнительное время на исполнение.

Надежный помощник при контроле качества данных

Справиться с большими потоками информации поможет решение Almaz Monitoring — самообучающаяся интеллектуальная система, разработанная ООО «Инлексис» (входит в Лигу Цифровой Экономики).

Если говорить о механике инструмента, то Almaz Monitoring отдает предпочтение анализу данных с помощью алгоритмов и математических моделей. Система изучает исходную информацию и формирует правила проверки, а также обучает модели для мониторинга статистик в источнике.

Во время анализа решение взаимодействует с выборкой, что обеспечивает меньшую чувствительность к росту объема данных в рамках одного источника, а также позволят снизить нагрузку на БД, так как обработка происходит именно на стороне системы. Работа с выгруженным массивом информации позволяет строить большое количество проверок для каждого поля.

Система подойдет для предприятий из различных отраслей экономики, включая ретейл, ТЭК, телеком, банковский сектор и др. Она использует современные математические алгоритмы и технологии машинного обучения для обнаружения аномалий в операционных процессах, потоках данных, корпоративных хранилищах и финансовых отчетах. Благодаря этому заказчики смогут проще и быстрее ликвидировать сбои и неполадки, а также предотвращать их возникновение в будущем.

Давайте представим, что у заказчика есть система целевого маркетинга, которая предлагает скидку клиентам, склонным к оттоку. Каждый день на основе скоринговой модели она формирует список покупателей и делает им предложение о скидке. В случае сбоя модели система быстро идентифицирует аномалию в данных (изменение распределения или среднего значения, а также выход за интервал 0–1) и просигнализирует об этом сотруднику, который сможет отключить рассылку до исправления инцидента.

Преимущества для заказчика

Ключевые достоинства внедрения системы Almaz Monitoring:

  • Всесторонний контроль качества как потоковых, так и хранимых данных.
  • Наличие большого количества коннекторов к различным источникам данных.
  • Быстрая и легкая настройка системы.
  • Наглядная аналитика о результатах проверок.

Например, в рамках использования услуги можно оценить динамику продаж, качество клиентского профиля и уровень сервиса. Или автоматизировать обработку входящих данных — в отличие от человека, система способна проверять поступающую информацию, помечая участки с некондиционными сведениями и регистрировать инциденты.

Помимо этого, решение отличается следующими преимуществами:

  • Комплексно справляется со всеми задачами за счет встроенных механизмов машинного обучения.
  • Автоматически отслеживает качество и достоверность данных.
  • Выявляет неточности и аномалии, учитывая сезонность, специфику и статистику.
  • Справляется с высоконагруженными потоками информации.
  • Отправляет уведомления всем заинтересованным лицам в случае чрезвычайных ситуаций по электронной почте или СМС.
0
1 комментарий
Виктор Борисов

Увидел в метро у симпатичной девушки рюкзак вашей лиги. Зашёл почитать: новость про спорт, про соглашение с ОС Аврора и вот эта статья. Дай думаю почитаю про алгоритмы, а тут - а купите алмаз мониторинг, он всё умеет...

Позорище

Ответить
Развернуть ветку
-2 комментариев
Раскрывать всегда