{"id":14284,"url":"\/distributions\/14284\/click?bit=1&hash=82a231c769d1e10ea56c30ae286f090fbb4a445600cfa9e05037db7a74b1dda9","title":"\u041f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0444\u0438\u043d\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435 \u043d\u0430 \u0442\u0430\u043d\u0446\u044b \u0441 \u0441\u043e\u0431\u0430\u043a\u0430\u043c\u0438","buttonText":"","imageUuid":""}

Как начать зарабатывать на ML. Теория

Сергей Щербаков
Руководитель управления архитектуры данных и бизнес аналитики банка "Санкт-Петербург"

Я продолжу гнуть свою линию из прошлой статьи – хайп, связанный со словами «искусственный интеллект» и «машинное обучение» уходит в прошлое и многие задаются вопросом – в как зарабатывать на этом деньги? При этом все больше исследований говорят нам о том, что лишь небольшая доля проектов с использованием ML доходит до продуктива и еще меньшая доля начинает приносить деньги.

Исходя из моего опыта, если разделять широкими мазками, то проблемы можно поделить на три большие кучки:

1. Нет данных или с ними проблемы. Здесь все просто – нет данных = нет денег. Про это написано уже много, поэтому повторяться не буду.

2. Технологические проблемы – это могут быть проблемы с командой, с автоматизацией, с железом или со всем этим вместе. Эти проблемы адресую к своей прошлой статье про уровни зрелости — каждом уровню зрелости свои задачи по сложности и отдаче. Повторяться опять же не хочется.

3. Проблемы с бизнесом – опять же в широком смысле этого слова. И именно на этом я и хочу остановиться.

Есть простая истина, которая пока не для всех очевидна — сделать ML-модель, которая что-нибудь спрогнозирует или разложит по похожим или даже соптимизирует — это даже не половина дела (если вы хотите заработать денег, конечно же). Самое веселое – это убедить бизнес, что на вашем «черном ящике» можно делать деньги и ему можно верить.

И на самом деле, звучит все просто и логично — для получения прибыли нужно сделать ML-модель частью бизнес-процесса, где она участвует в качестве элемента принятия решения. На словах звучит просто, а на деле – как любое изменение бизнес-процессов, очень сильно зависит от многих факторов, таких как административный ресурс, человеческий фактор, передел зон ответственности и многие другие «приятные сердцу» слова.

Для визуализации места Машинного Обучения в современном мире принятия решений есть несколько гениальных в своей простоте диаграмм. Первая из которым максимально проста:

Из нее видно, что Машинное Обучение, как частный случай аналитики данных, стоит ровно между большим миром данных и людьми бизнеса. Другими словами, аналитика в общем случае — это инструментарий по монетизации данных. Вывод из этой диаграммы я делаю простой – зарабатывание денег на данных зависит от двух вещей:

- объема накопленных данных (а если у вас их нет, то начинайте собирать);

- насколько эффективно вы используете имеющийся инструментарий и оперативно овладеваете новым.

Тему с доступными данными в этой статье договорились не рассматривать (надеемся, что все слышали про «Нефть 21 века» и т.п.), шутки про «размер имеет значение» тоже давайте пока отложим в сторону. Давайте сосредоточимся на использовании инструментария, ведь основная эффективность кроется здесь. И, как это ни странно, инструмент под названием «Аналитика» можно использовать по-разному. В свое время мне очень понравилась картинка с одной из презентаций наших западных коллег, которая показывает варианты использования аналитики в работе:

Она чертовски логично показывает, что граница между человеком и данными при принятии решения может проходить в совершенно разных местах. Если кратко пробегаться по основным видам аналитики и ее использования, то:

- Отчётность — самый базовый вариант аналитики. Этот простейший способ визуализации уже случившихся данных для человека, который даёт понять, что происходило вокруг интересующего сегмента. И это уже дает возможность принимать решение на основании данных. Дальше идет движение в сторону BI дашбордов, когда данных становится больше, обновление в реальном времени и т.п. Соответственно, и принятие решений происходит быстрее и на основании бОльшего количества данных.

- Прогнозная аналитика – это уже ML. Этот вид аналитики отвечает на простой вопрос «что случится завтра». Грубо говоря, на данном этапе появляется сущность, которая говорит нам, что завтра курс доллара будет равен 80 рублям. Но в любом случае решение остается за человеком. Хочешь — покупай, не хочешь — не покупай.

- Следующий этап – предписывающая аналитика, которая отвечает на более сложный вопрос «а что надо сделать, чтобы произошло то, что выгодно для нас?». Продолжая аналогию с курсом доллара, то завтра машина тебе скажет «покупай», а послезавтра «продавай» — потому что прогноз на завтра 80 рублей, а на послезавтра 90 рублей, а на горизонте недели — 85. В таком случае единственное участие человека — перевести решение в действие. Если добавить сюда немного автоматизации, то весь процесс будет зависеть только от машины: она спрогнозировала, когда будет самый выгодный курс на покупку, когда ожидается самый выгодный курс на продажу, в нужный час купила, в нужный час продала, потом посчитала профит. Никакого ручного труда, чисто деньги. Красота!

Понятно, что это упрощенная и идеализированная картина мира, но она показывает целевое использование аналитики в принятии решения. Но кто сказал, что использование бывает только целевое? Если бизнес не доверяет «черному ящику» ML-модели, то кто мешает просто «иметь в виду» рекомендации, и использовать ее в лучшем случае как один из вариантов отчета? И это вопрос не техники, вопрос исключительно в людях.

В принципе, на нашем уровне развития ML и автоматизации в Банке «Санкт-Петербург» мы можем реализовать связку «предписывающая аналитика — автоматизация» и оставить человеку роль контролера и наблюдателя. Но будем честны с собой – сейчас это используется редких бизнес-процессах и путь, который приходится пройти для полной реализации такой цепочки очень длинный.

Для примера из недавнего: этой весной в Банке мы сделали модель на основе логики предписывающей аналитики. Она призвана сделать оптимальный выбор – что нужно предложить клиенту, в какой момент времени и в каком канале, чтобы увеличить прибыль с клиента. Сделали модель, оптимизационный алгоритм, провели пилотный A/B тест – машинный выбор vs стандартный набор коммуникаций, стратификация выборок, все как полагается. В результате по рекомендациям модели мы заработали больше, чем в случае с контрольной группой, где коммуникация проходила как обычно и на 100% зависела от человека. И казалось бы – радуйся, внедряй и получай выгоду.

Однако в реальности до полной автоматизации процесса еще далеко. Ведь все понимают, что надо перестраивать достаточно многое – тут и доработки бизнес-процессов по назначению коммуникаций и пересмотр процессов планирования продаж синхронно с изменением оптимизационной матрицы модели (ведь модель максимизирует прибыль, а у многих планы стоят в штуках, и причем конкретных штуках) и т.д. и т.п. И звучит вроде достаточно просто, но когда сходится недоверие к новому «черному ящику» вместе с потенциальными «провалами» в продажах конкретных продуктов (потому что угодить всем нельзя – выбираться будет один), то дело идет не быстро и периодически приходится привлекать административный ресурс.

И это не наш уникальный случай – с этим сталкиваются практически все компании, которые довели более или менее серьезные модели до вывода на продуктив. Облегчить процесс внедрения может только одно – плотное общение с бизнесом. Ведь для них делается этот инструментарий, и именно бизнес надо научить им пользоваться, иначе пример микроскопа и гвоздей будет настольной картинкой. И здесь правильный вопрос, который должен задавать себе ответственный за ML в компании (руководитель отдела, тим-лид и далее по грейдам) – «а в какой же момент времени работы над ML-моделью надо прийти к бизнесу, чтобы внедрение прошло максимально быстро, а использовалась она максимально правильно?».

И правильный ответ – приходить нужно постоянно. Но важное дополнение – на каждом этапе набор вопросов для бизнеса будет свой.

0
2 комментария
Nocto Dolfus

Зачем вы вообще это пишете? Тут нет инфоповода. Просто словоблудие на тему. Я понимаю, там, рассказать о том, что что-то сделали. А тут вы что сделали? Потеоретизировали на ML? Открою тайну: все взрослые мальчики это делают, темы разнятся.
Куда приятнее читать ваших коллег, которые в отличие от вас чего-то добились.

Ответить
Развернуть ветку
long strory

Помогите банку "Банк Санкт Петербург", там ПР менеджер в ветку нужную не может ответит в комментариях, все в главную наваливает, возможно ML даст результат

Ответить
Развернуть ветку
-1 комментариев
Раскрывать всегда