Почему 87% проектов с ИИ не доходят до стадии эксплуатации и как это исправить

Несмотря на преимущества машинного обучения, эффективно использовать ML-модели сложно. Данные, на которых они строятся, устаревают, бизнес-цели могут меняться, а при совместной работе технических и бизнес-команд может возникать недопонимание. Раньше такая же проблема возникала при разработке ПО, и ее решили с помощью DevOps-подхода (Development Operations). Благодаря ему время разработки сократилось, скорость развертывания возросла, а релизы стали проверяемыми и надежными.

Индустрия оценила эти преимущества, и часть DevOps-принципов перекочевала в MLOps (Machine Learning Operations).

MLOps (Machine Learning Operations) — это набор методов и практик, которые помогают построить прозрачный процесс разработки и развертывания ML-моделей.

Объясним на примере, почему обучать ML-модели сложно и при чем здесь MLOps. Представим, что банк хочет создать модель машинного обучения, чтобы она помогала принимать решение о выдаче кредитов.

Когда дело доходит до реализации, возникают проблемы:

Сложно наладить совместную работу команд. На каждом этапе с данными работают разные специалисты, они используют в работе различные инструменты.

Пример. На начальном этапе ML-модель разрабатывает дата-сайентист. Он проводит эксперименты и получает модель. Но затем из нее необходимо сделать сервис, то есть ее нужно упаковать, обеспечить то же самое окружение (версии библиотек), наладить мониторинг и дальнейшее обучение при получении новых данных. При этом специалист, который выполняет эти задачи, может вообще мало понимать в ML-моделях.

Модели машинного обучения отличаются от обычных приложений и чувствительны к данным. Любые изменения в данных меняют саму модель. Это большая проблема, поскольку данные могут обновляться.

Пример. Допустим, в 2019 году (в доковидные времена) мы обучили ML-модель распознавать проблемы с легкими. Но затем появился вирус Covid-19, и и теперь наша модель пропускает некоторые проблемы — при ее обучении мы не знали про новый вирус.

Команды могут тратить время и ресурсы на одни и те же эксперименты. Они могут не знать, что коллеги уже провели такой эксперимент и получили результаты.

Важно создавать каталог моделей. Он помогает следить за метриками качества. Например, в каталоге можно увидеть, что результаты новых экспериментов лучше или точнее предыдущих.

Эти сложности помогает решить MLOps-подход. Он применяется, чтобы стандартизировать все этапы работы с ML-моделями, и помогает полностью раскрыть потенциал машинного обучения.

Почему 87% проектов с ИИ не доходят до стадии эксплуатации и как это исправить

Производительность. С MLOps процесс разработки моделей машинного обучения становится автоматизированным и более упорядоченным. Стандартизация рабочих процессов минимизирует ошибки и снижает риски. Это экономит время сотрудников и позволяет развертывать модели без задержек. А создание автоматизированных пайплайнов позволяет дата-сайентистам сосредоточиться на анализе данных и обучении новых моделей.

Надежность. MLOps позволяет непрерывно мониторить и тестировать модели машинного обучения. Количество человеческих ошибок сокращается, и результаты работы ML-моделей становятся более точными.

Это особенно важно для компаний, которые используют ML-модели для поддержки принятия решений, например, для одобрения кредитов. Из-за устаревших моделей деньги могут получить неплатежеспособные клиенты.

Экономия. Если у компании есть ML-модель, которая правильно работает, не придется тратить время и деньги для разработки новой. Кроме того, MLOps-подход минимизирует количество человеческих ошибок, что также приводит к снижению затрат.

Воспроизводимость. С MLOps каждую модель можно запустить заново и получить те же результаты, что и раньше. Воспроизводимость помогает командам уменьшить количество ошибок при переходе проектов от разработки к проду. Она обеспечивает согласованность данных и дает возможность масштабировать ML-модель в случае роста бизнеса.

Компаниям, которые решат внедрить новый подход, понадобится время на изучение инструментов для MLOps, но конечный результат в разы упростит процесс разработки и развертывания ML-моделей.

Применение машинного обучения в бизнесе — одна из тем VK Cloud Conf, конференции для компаний, разрабатывающих собственные ИТ-продукты. Мероприятие пройдет 8 июня в Москве, также доступна онлайн-трансляция.

В программе — повышение эффективности разработки с помощью облачных сервисов, современные подходы к работе с данными, лучшие практики и подходы к облачной безопасности.

Посмотреть программу и зарегистрироваться на VK Cloud Conf.

Почему 87% проектов с ИИ не доходят до стадии эксплуатации и как это исправить

Что такое MLOps и зачем он нужен

Что MLOps-подход дает бизнесу