Для понимания текущей ситуации, полезно знать предысторию. Когда пионеры начали масштабировать проекты с ИИ, они обнаружили, что запускать пилоты и достигать впечатляющих результатов обманчиво легко, но чертовски трудно встроить модели машинного обучения в бизнес-процесс. Сейчас, по моему внутреннему ощущению, примерно 90% всех экспериментов не доходит до боя. Этот парадокс и породил новые подходы, позволяющие трансформировать операционные модели компаний.
Управление данными окончательно оформилось в отдельную дисциплину data governance, и ИИ останется одной из основных тем, определяющих инфраструктурные решения в ближайшем будущем. Для ускорения запуска пилотных проектов в производство требуется определенная инфраструктура, получившая название MLOps по аналогии с DevOps применительно к моделям и технологиям машинного обучения.
Текущие MLOps системы в значительной степени ориентированы на работу с моделями машинного обучения, а не с самими данными. В новый ландшафт также хорошо встраиваются такие инструменты, как DVC и Pachyderm, поддерживающие git-образный подход к управлению данными. Тренд на версионирование также подтверждается новым витком развития систем хранения больших данных - например, Delta Lakes.
Что же до вертикально-интегрированных приложений, что они могут поставить под угрозу основные источники конкурентных преимуществ компаний. Поставщикам необходимо обучать свои инструменты ИИ, используя конфиденциальные данные клиентов. В этом ключе сопутствующим трендом видится развитие направления AutoML: вместе с отраслевой экспертизой - это хороший путь для стартапов. AutoML решит 80% самых неинтересных и малоценных задач, тем самым уменьшив порог входа для создания моделей машинного обучения, и даже позволит бизнес-аналитикам (или citizen data scientist) использовать передовые методы моделирования без помощи аналитиков данных. Продвинутые задачи будут ждать решений от высококвалифицированных команд.
В статье удивительно точно указаны отрасли с наибольшим потенциалом. Применительно к нашей стране, приоритет также за сельским хозяйством и медициной, что хорошо отражено в недавно вышедшем федеральном проекте «Искусственный интеллект».
Интересно, по каким фичам они посчитали объёмы финансирования? Что именно они заложили в полученную цифру?
Объем финансирования посчитали как количество денег, которые подняли компании, связанные с разработкой беспилотных автомобилей, за 2019 год. Опираются в оценке на данные от PitchBook.
Про MLOps я не слышал, а вот про DataOps, который ориентирован на работу с самими данным как раз слышал.
Область молодая, думаю, мы увидим еще много названий :)
"по моему внутреннему ощущению" - весомое обоснование)