“Каждый новый ИИ оптимизирует наши процессы на 20%” – поговорили с экспертами из СКБ “Контур” и Analytic Workspace

Эта статья написана по материалам прямого эфира «Данные и искусственный интеллект: что реально применяется, а что пока нет” с экспертами из мира Data Driven Никитой Тарасовым, Head of Data Science в СКБ »Контур” и Александром Кварацхелия, кандидатом математических наук, архитектором BI-системы Analytic Workspace. Запись трансляции: https://www. youtube. com/watch? v=7LzdQdME8Sc

Глобальный институт McKinsey ожидает, что около 70% компаний внедрят как минимум один тип технологии искусственного интеллекта к 2030 году. Однако когда начинаешь разбираться в теме, то оказывается, что промышленных примеров эффективного применения ИИ в работе с данными не так и много.

А если смотреть вне ИТ-компаний, то примеры применения ИИ становятся штучными. Попробуем отделить хайп от практики.

Глобальный институт McKinsey ожидает, что около 70% компаний внедрят как минимум один тип технологии искусственного интеллекта к 2030 году.

Тренды развития ИИ для обработки данных. Что на слуху?

Самый распространенный случай — это применение ИИ для обработки оцифрованных данных о пользователях/клиентах: например, платежеспособность (скрининг в банках для принятия решений о выдаче кредитов), интересы (для персонализированной рекламы) и т.д. Подобные системы сейчас распространены повсеместно и их область применения только расширяется.

Другой современный тренд — применение ИИ для анализа неструктурированных данных — картинки, фотографии, аудио. Уже сейчас на этих данных искусственный интеллект научился решать задачи не хуже, чем человек, а в каких то сценариях даже лучше.

Разделяем понятия ML и AI

Термин искусственный интеллект более широкий, чем машинное обучение (ML) Задача ИИ — решать какие-то вопросы на интеллектуальном уровне, не хуже, чем это делают люди.

Эти системы учатся не столько на накопленных данных, сколько на эпизодах взаимодействия с некой средой.. Другими словами, базой для машинного обучения служат не данные как таковые, а исторический набор взаимодействий со средой.

Пример:

Искусственный интеллект в шахматах. Первые компьютеры учились на прошлых играх, беря за основу огромную историю комментирования шахматных партий. Эти алгоритмы, действуя в рамках установленных правил игры, достигали гроссмейстерского уровня (вспоминаем серию матчей Гарри Каспарова против ИИ в 90-х годах) . А затем наступила революция так называемого обучения с подкреплением: взяли две системы и заставили их играть друг с другом. И за короткое время, сыграв каких-то 60 миллионов партий между собой, они уже стали играть лучше, чем люди.

Применение ИИ в BI-системах

Какова практика использования ИИ для построения аналитики и визуализации данных в BI-системах?

ИИ помогает создать набор данных как таковой

Прежде чем визуализировать, нужно подготовить витрину данных, приведя полученные данные в правильную форму: очистить данные, привести к нужному типу, структурировать, убрать пропуски. Для этого применяются специальные ИИ, которые работают “под капотом” BI-системы.

ИИ используется для прогнозирования и выявления аномалий

Если рассматривать BI-систему как процесс сбора разнородных данных в единую витрину с последующей визуализацией — человеку интересно сделать следующий шаг: превратить уже очищенные данные в источник для получения новых знаний, другими, последующими алгоритмами.

Здесь основное поле для применения ИИ — это прогнозирование и выявление аномалий. Если мы визуализируем некие зависимости в табличных данных — задача ИИ в прогнозировании дальнейшего развития ситуации с учетом встречавшихся особенностей, которые ИИ может заметить и подсветить.

Найти закономерности в несвязанных данных

Помните фильм “Расплата” с Беном Аффлеком? Там главный герой - аутист с мощными математическими способностями - красиво расписывает на прозрачных стенах множество несвязанных между собой данных и находит в них закономерности. Давайте разберемся, умеют ли так делать современные ИИ, и если да - применяются ли их чудесные способности в реальной жизни.

Действительно, при наличии большого массива на первый взгляд несвязанных данных, ИИ может “компоновать” их в разных вариантах, пока не получит математическую модель, которая работает и позволяет строить прогнозы с высокой степенью достоверности.

Пример:

Бизнесам с различными вариантами доступа по подписке важно понимать, с какой вероятностью тот или иной клиент продлит подписку на следующий срок. Аналитические отделы с помощью ИИ ищут маркеры, по которым можно предсказать поведение клиента. Например, если клиент скачал менее 5 документов за месяц - он скорее всего “отвалится”, и если таких клиентов много - нужно думать, как поправить путь пользователя в системе - может поменять цвет кнопки “Скачать” с желтого на зеленый и это даст бизнесу полмиллиона долларов дополнительной прибыли в год?

Три причины демократизации ИИ в 2020-е

Популяризация и доступность ИИ в сфере бизнеса сейчас дошла до такой стадии, что чуть ли не каждая организация может позволить себе внедрить ИИ в повседневную деятельность. И хотя большинство методов, которые пользуются искусственным интеллектом (глубокие механизмы нейронных сетей) разработаны еще в прошлом веке, однако “бум” доступного ИИ возник только сейчас. Каковы причины этого явления?

  1. К 2020-м человечество накопило данные в цифровом виде и публичном доступе
  2. Все математические алгоритмы и модели запрограммированы на всех языках, на всех платформах, существует мощное комьюнити, которое поможет решить любую задачу, частички “пазла” для которой уже готовы
  3. Появились действительно мощные хорошие машины, много графических устройств, на которых задачи ИИ могут выполняться.

Вследствие этих причин возникло и множество обучающих курсов. Получается, что для освоения ИИ сейчас не требуется такого мощного бэкграунда, как на начальных этапах его развития. И если в компании есть энтузиасты уровня около технических специалистов с креативной идеей - уже можно начинать реализовывать ИИ-проект.

Пример:

Мощный цифровой проект распознавания эмоций на лицах был создан небольшой группой энтузиастов - бизнес- и системных аналитиков. Они взяли готовые open source модели и придумали им новый способ применения - определение реперных точек на лице, определяющих ту или иную эмоцию. Этот путь сейчас доступен как никогда.

Где найти специалистов по ИИ и сколько они стоят?

Какие специалисты необходимы в компании, чтобы начать внедрять искусственный интеллект как элемент бизнеса? Как сформировать команду и в какие зарплатные ожидания укладываются такие специалисты?

Начнем с того, что сейчас многие готовые решения доступны для освоения специалистами с широким спектром ролей: это могут быть и аналитики данных, и системные аналитики, и фронт-разработчики - все эти люди могут использовать некие готовые инструменты или “кубики” для сборки необходимого решения на базе классических моделей прогнозирования.

Совсем другой уровень знаний требуется, если готовых инструментов или их качества недостаточно, либо готовые инструменты настолько дорогие, что становятся недоступными для компании. Тогда может возникнуть ситуация, когда компании выгодно разработать что-то самостоятельно, и вот тут уже требуются специалисты, способные двигать передний край прогресса. Это дефицитные кадры с очень высокими зарплатами. И зачастую со временем уже вокруг этих людей бизнес начинает строиться и их решения со временем монетизируются.

Специалисты высочайшего уровня с космическими зарплатами становятся нужны компании только тогда, когда готовых инструментов не хватает и становится выгоднее разработать свое решение.

Чаще всего это актуально для ИТ-компаний либо для крупных компаний с большими функциональными зонами. Скажем, если в компании отдел продаж 1000+ человек, то для оптимизации работы колл-центра компании выгодно иметь свое распознавание речи, потому что на этих объемах его разработка стоит существенно дешевле, чем покупка.

Решили внедрять ИИ в компании. Растить людей внутри команды или отдавать на аутсорс?

Возвращаясь к бизнесам не из сферы ИТ - производство, ритейл, медицина и т.д. - как внедрять ИИ в таких компаниях? Задачи разные: это и управление спросом, и управление остатками, и различное прогнозирование. Стоит растить ИТ-компетенцию внутри или проще нанять сторонний бизнес для внедрения готового решения?

Есть несколько подходов к решению этой задачи:

  • Нанять подрядчика

Если в компании до сих пор не было компетенции ИТ-специалистов, готовых внедрять сложные решения с нуля, то чаще всего выгоднее нанять стороннюю ИТ-компанию для внедрения готового решения, закрывающего задачи бизнеса.

  • Растить своих

Если же есть желание растить компетенцию у себя, то помимо собственно команды полезно пригласить на первых порах консультанта или ментора, который сделает анализ потребностей компании. Консультант подскажет, достаточно ли будет существующих инструментов и компетенций компании для решения поставленной задачи или придется искать другой подход.

  • Третий путь

Компания нанимает подрядчика для внедрения и поддержки у себя готового решения. Но одновременно в штат берется специалист (или группа), который на первых этапах выполняет роль связующего звена между заказчиком и подрядчиком. А через год-два, когда он всему научится, контракт с подрядчиком перерастает уже в рабочий проект под этого человека и набор собственной команды инженеров.

Требования к аналитикам данных растут: визуализаций и отчетов уже недостаточно?

До последнего времени задачей аналитиков данных было правильно визуализировать наборы данных и своевременно представить отчеты руководству. Однако есть ощущение, что этих компетенций становится недостаточно - имеется запрос на машинное обучение и прогнозирование. Так ли это?

Действительно, машинное обучение, а точнее алгоритмы, подходы, которые характерны для машинного обучения, сейчас тесно проникают в работу специалиста-аналитика данных. Дело в том, что данных становится настолько много, что их ни одна система типа Excel переварить не может. В изменившихся условиях меняются как и способы анализа данных, так и необходимые компетенции людей.

Происходит явное разделение ролей: непосредственно аналитическая и ML-инженерная составляющая машинного обучения.

Для аналитиков стало важным навыком знание алгоритмов, способов по-другому взглянуть на данные. Речь не только и не столько о способах построения модели, а скорее о способности точно представлять, какие знания мы хотим получить с помощью этой модели.

Ключевая способность человека для работы с ИИ - чёткое представление о том, чем ИИ сможет ему помочь.

Зачастую задачу проще сформулировать на Python: что ты хочешь сделать с данными, какую модель построить и какую получить визуализацию. Причем для задач аналитики данных Python не надо знать на очень глубоком уровне, потому что этот язык программирования задает просто канву обработки данных. И сейчас реальные аналитики, которые хотят работать с реальными задачами, обязательно идут со знанием Python, именно в части чтения данных и правильной их обработки.

Однако ключевая способность, которая нужна человеку для работы с искусственным интеллектом - это четкое представление о том, как упаковать ИИ в определенный внутренний сервис и наладить взаимодействие с ним улучшаемой информационной системы. Как подготовить правильный тест для обучения, который будет сбалансирован и дополнен всеми данными. И на какой именно результат мы рассчитываем, внедряя ИИ в структуру бизнеса.

Насколько реально внедрение ИИ повышает эффективность компании?

Этот вопрос мы задали Никите Тарасову, Head of AI в Контуре. Область деятельности Никиты - развитие Центра ИИ, оптимизация внутренних процессов компании и развитие продуктов компании с помощью внедрения механик ИИ. По словам Никиты, эмпирически выведенным ориентировочным результатом грамотного внедрения ИИ в бизнес-процесс можно считать 20% экономии при организации бизнес-процесса. Разумеется, этот ориентир сильно колеблется в зависимости от конкретной ситуации, масштабов бизнес-процессов и стадии развития компании.

Если ваш бизнес-процесс стоил 100 рублей, то после оптимизации он должен стоить 80, и в зависимости от масштаба это или хорошая и амбициозная цель, или игра не стоит свеч. С точки зрения больших процессов 20% экономии - это действительно большие деньги. Или если мы говорим, что это значимая составляющая какого-то продукта и часть его экономики, то тоже большие деньги.

Никита Тарасов, Head of Data Science в СКБ Контур

Выводы. Когда игра с искусственным интеллектом стоит свеч?

Подводя итоги, скажем, что внедрив искусственный интеллект в бизнес, можно довольно серьезно оптимизировать процессы. Многие решения для бизнеса уже включают ИИ-компоненты и организациям стоит обращать внимание на такие продукты. Вендоры стараются усилить свои продукты элементами искусственного интеллекта. Рядовому бизнесу уже сейчас можно внедрить ИИ в свои процессы, не тратя на это колоссальные бюджеты – тот же голосовой ассистент для автоответов работает на базе ИИ и не требует собственной разработки.

Но если есть силы и бюджеты для создания собственных наработок с искусственным интеллектом (много данных или рождается компетенция внутри компании), то можно в это вкладываться, формируя внутри собственную команду. И эта команда на первых порах может состоять из дата-аналитиков, которые уже сейчас обладают знаниями и могут внедрить существующие ИИ-алгоритмы для работы с накопленной информацией. Для более сложных решений нужны саентологии и инженеры, то есть те, кто готов копнуть глубже, написать новые алгоритмы или более сложные комбинации существующих алгоритмов.

Мы регулярно проводим прямые эфиры с экспертами из мира данных и BI – анонсы новых эфиров и другие полезности доступны в телеграм-канале Data Driven культура. Подписывайтесь на канал, чтобы не пропустить интересные события 😉

0
7 комментариев
Написать комментарий...
Вася Пражкин
Эти системы учатся не на данных, а на эпизодах взаимодействия с некой средой.

Анатолий, а Вы точно хорошо понимаете, как работают аалгоритмы ИИ?

Ответить
Развернуть ветку
Analytic Workspace
Автор

Алгоритмы обучения с подкреплением действительно учатся на эпизодах взаимодействия со средой) https://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D1%81_%D0%BF%D0%BE%D0%B4%D0%BA%D1%80%D0%B5%D0%BF%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5%D0%BC

Ответить
Развернуть ветку
Вася Пражкин

Замечательно, только Reinforcement learning все равно основан на данных.

Ответить
Развернуть ветку
Analytic Workspace
Автор

Ок, смягчил формулировку. Однако Интеллектуальная (вторая "И" в аббревиатуре "ИИ") функция достигается именно за счет адаптивности и приспособляемости к меняющимся условиям и нестандартным эпизодам при функционировании систем. Именно это отличие AI от классического ML и хотелось подчеркнуть.

Ответить
Развернуть ветку
Вася Пражкин

Ну там не так много адаптивности-то. Вся революция AI последних лет основана на том, что данных стало не просто много, а на много порядков больше, чем использовалось в проектах раньше. И на таком увеличении исходных данных оказалось, что ИИ стал генерить качественно лучший результат, что мы видим по генеративным ИИ в последнее время.

Ответить
Развернуть ветку
Артём Торез

главное дать сотрудникам возможность изучать как можно применять ИИ

Ответить
Развернуть ветку
Андрей Епифанов

И главное не давать возможность начальникам изучать ии, чтоб вас не заменили

Ответить
Развернуть ветку
4 комментария
Раскрывать всегда