{"id":14279,"url":"\/distributions\/14279\/click?bit=1&hash=4408d97a995353c62a7353088166cda4ded361bf29df096e086ea0bbb9c1b2fc","title":"\u0427\u0442\u043e \u0432\u044b\u0431\u0435\u0440\u0435\u0442\u0435: \u0432\u044b\u0435\u0445\u0430\u0442\u044c \u043f\u043e\u0437\u0436\u0435 \u0438\u043b\u0438 \u0437\u0430\u0435\u0445\u0430\u0442\u044c \u0440\u0430\u043d\u044c\u0448\u0435?","buttonText":"","imageUuid":""}

Очистка данных: кейс Invitro

Invitro — частная медицинская компания в России, специализирующаяся на высокоточной лабораторной диагностике и оказании медицинских услуг.

  • Более 13 млн. пациентов в год
  • Более 1300 офисов в 6 странах — Россия, Беларусь, Казахстан, Украина
  • Более 800 серверов

Проблема

  • Общий размер клиентской базы на июль 2019 г. более 32 млн. записей
  • Каждый день операторы компании изменяют около 64 тыс. клиентских записей
  • Чрезмерные трудозатраты на обработку данных
  • Большое количество неполных и ошибочных данных в базе

Задача

  • Снизить влияние человеческого фактора при вводе и обработке контактных данных
  • Автоматизировать обработку, очистку и дедупликацию
  • Поддерживать гарантированное качество контактных данных клиентов

Решение

​Фрагмент сценария решения на платформе Loginom
  • Источник входных данных — консолидированная база MDM-системы
  • Использовалось решение Loginom Data Quality
  • Применялись стратегии полного совпадения и нечеткого поиска, основанного на расстоянии редактирования Дамерау-Левенштейна
  • Очистка и дедупликация данных происходит каждые 5 минут в режиме on-line
  • Внесение обработанных "золотых" записей в базу осуществляется подключением к шине данных через публикацию WEB-сервиса
  • Сценарии решения улучшены для обработки записей, содержащих буквы украинского и казахского языков
  • Сформирована эталонная запись более чем по 60 параметрам

Результаты

  • MDM–система автоматически обрабатывает более 180 тыс. записей в день
  • Запуск обработки происходит по расписанию в фоновом режиме
  • Снижены издержки на поддержку качества клиентских данных
  • Существенно уменьшен процент попадания плохих и неполных данных в базу
0
2 комментария
Евгений Морозов

Сколько потратили денег на внедрение?

Ответить
Развернуть ветку
Катя Матийченко
Автор

К сожалению не можем раскрыть цифры по конкретному проекту.
Если взять оценку из нашего опыта, то стоимость проекта по построению MDM-системы (лицензии на ПО + работы) начинается от нескольких миллионов рублей.

Ответить
Развернуть ветку
-1 комментариев
Раскрывать всегда