Автоматизация и машинное обучение: новые возможности для бизнеса

Сергей Каторгин, руководитель Центра разработки ПО “Лидер-ИТ” пообщался с Дмитрием Щипачевым, основателем технологической компании FINCH о том, как они отстроились от конкурентов, запустив новое агентство Ainch, и выделили отдельную команду, чтобы сосредоточиться на проблемах, связанных с использованием машинного обучения в бизнесе.

Автоматизация и машинное обучение: новые возможности для бизнеса

– У вас получается два отдельных бизнеса. Если говорить про стандартный аутсорсинг бизнес, который не с фокусом на нейросети, как там дела?
– Там все как обычно, он стабильно-стабилен. То есть там точек роста очень мало.

– Ну да, я читал интервью с iFellow, мы тоже с ними делали интервью, когда у них еще 500 человек было, сейчас тысяча. И они говорят, что отходят от того, чтобы стратегию на аутсорс, аутстаф делать, а больше именно на продукты ставку сейчас делают. Но это уже большой бизнес с большими ресурсами. У нас 15 человек, у нас другие стратегии. У вас сколько сейчас человек в общем?
– У нас где-то 50 человек.

– Вот 50 человек, и основной бизнес на Россию направлен или зарубежку тоже пытаетесь осваивать?
– Слушай, я думаю, что если ты будешь спрашивать меня про FINCH, то большинство вопросов будет не очень интересными, потому что мы не просто так все переделали и сформировали новый бренд, потому что мы принципиально новые подходы все на него перенесем. И там будем основной рост планировать. Более того, рост на этом направлении у нас будет конвертироваться в рост на FINCH, потому что там доля классического аутсорсинга тоже велика. Если проект мы начинаем собирать с использованиями нейросетей, там будет все равно 50-60% объема, который мы получим в обычном виде.

– На самом деле тема нейросетей – это очень актуально. Вчера тоже разговаривали с коллегами. Они у себя на внутренний проект взяли питониста для наработки компетенций. У вас как произошло? Какой-то клиент появился?
– Мы на самом деле пару лет уже занимаемся активно этой историей. У нас отдел машинного обучения. Там человек 5 или 6, был проект от основного бизнеса. А сейчас мы просто сконвертировали в отдельное направление, и его активно продвигаем на рынок. Одна из прикладных задач, которые мы решаем - построение управляемой автоматизированной коммуникации. Управляемая коммуникация – это когда ИИ тебе не просто отвечает, а его задача – довести тебя до какого-то результата.

– Это крутая штука.
– Да, мы сейчас активно автоматизируем коммуникацию в области продаж для нескольких клиентов. Там очень много разных специфических кейсов, поэтому это очень сложный ландшафт.

– Здесь уточню, уже есть клиенты на эту модель?
– И не один. Любая компания, в которой сидит какое-то количество менеджеров, которые занимаются общением с клиентами, может использовать управляемую коммуникацию. Если компания продает через интернет и у нее не высокий чек, 100-500 долларов, то это очень просится под автоматизацию, потому что отдел поддержки, который добивает сделки, поддерживает продажи и стоит очень много денег. Однако это непростая история, потому что даже если взять какие-то примитивные продажи, реализовать их так, чтобы конверсия не просела и заменить человека, это довольно сложно. Требуется наличие процессов по мониторингу, тестированию и обучению. Начиная с определенного размера чека, у тебя уже риски того, что ты потеряешь лид. Если ты сам, твой бизнес, получил лид на 100 тысяч рублей, ты его передал менеджеру. Если пришел лид на 10 миллионов, ты его обработал сам.

Лиды, которые приходят по нижней границе тарифной сетки, можно автоматизировать, повышая порог стоимости сделки при улучшении этой автоматизации и ее производительности. Естественно, чем выше стоимость сделки, тем более индивидуальные подходы требуются клиенту в коммуникации, в которой робот не справляется. Робот обрабатывает входящие запросы, а не outbound, который контактирует со всеми. На outreach много роботов, они очень простые, их задача добиться какого-то ответа, а потом сразу переключить на человека. То есть, условно говоря, outreach робот - это просто массовая рассылка по какой-то почте, например, или LinkedIn. Он делается очень просто, потому что его задача просто посмотреть твой профиль, понять, кто ты такой, и сформировать для тебя, там, в худшем случае, типа, просто broadcast-месседж, один и тот же месседж, всем клиентам.

В лучшем случае, чтобы повысить конверсию, формируется какое-то уникальное послание. Он идет на твою страницу социальной сети, смотрит твои последние публикации, которые ты написал. Напишет тебе – “Я увидел, что ты писал публикацию на тему компьютерного зрения при обработке документов, вот мы как раз сделали продукт на эту тему.” Такое тоже можно, но в этом не очень много смысла, потому что ты автоматизируешь, по сути, одно сообщение, и там нет никакой необходимости именно ИИ подключать. Входящие лиды наоборот. Например, падает заявка, кто-то хочет купить онлайн-курс. Чтобы от этого желания дойти до продажи, нужно реализовать много разных нюансов, деталей и уточнений. Например, понять, какой план рассрочки он хочет, в каком банке хочет его получать, когда он хочет начинать обучение, какой у него запас времени.

Вот все эти процессы как раз можно автоматизировать, таким образом снять нагрузку в контакт-центре. Этим мы и занимаемся. Причем, в зависимости от сферы, там могут быть очень разные методологии и механизмы.

Все это делается в плотной интеграции с контуром клиентов. То есть, бот может не только говорить, он может еще и подключать определённый бизнес-сценарий. Например, он может предложить вам пройти маленький опрос. Опрос проводится через LMS-систему. Бот обращается к API, и при прохождении этого теста из нее же вытягивает результат, какой там курс вам предлагают.

– Здесь интересно, какие в этом плане цели стоят – эту систему предлагать каким-то крупным игрокам или в розницу продавать?
– Мы взяли нашу бизнес-модель с FINCH и идем в крупные бизнесы, в enterprise-компании. Если внутри России, то это может быть 15-20 тысяч человек. Если за пределами России, то там могут быть разные варианты. Главное, чтобы компания была жива и активно развивалась.

Языковые модели - это не все, что мы делаем. Eсть направление классификации, то есть это нейронные сети, которые классифицируют те или иные объекты. Это могут быть, например, документы, тендеры на заявку или это могут быть документы, состоящие из чего угодно. Любые объекты, которые нужно автоматизировано классифицировать. Например, на заявки и на спам, но именно в контексте конкретного бизнеса и конкретной базы. Мы обучаем такие сети. Это используется в разных университетах и бизнесе. Примеры не буду называть, потому что мы пойдем сильно в сферу под NDA, но это направление, которое приносит довольно хороший доход.

Другие направления – это в основном промышленность, сельское хозяйство и животноводство – это просто огромный спектр задач.

– А какие там задачи?
– Примером задачи может быть система неразрушающего контроля качества сварки на трубопроводе. Мы проектируем систему, которая умеет определять параметры среза и параметры овальности, и определять качество выполнения сварного шва. Сейчас это очень часто делается руками, но есть много способов, таких как лазеры и компьютерное зрение. Наша система позволяет повесить камеры и не нарушает производственную линию. Если говорить о животноводстве, мы много чего делаем здесь для свиноводства. Там тоже задачи похожи. Можно, например, по разделенному мясу определять его различные параметры, такие как правильность разрезки, толщину и слой сала, по которым кусок мяса будет распределен по сорту. Приемка скота вызывает тоже много вопросов. Например, приводят тебе 200 голов заявленных, как свинья, первый сорт такого цвета, такой породы. А по факту выясняется, что там не столько голов, сколько надо, и качество другое. И это все определяется компьютерным зрением.

– Если говорить про направление чат-ботов или компьютерное зрение, где наибольший может быть рост в России в частности?
– Я думаю, что именно управляемая коммуникация сейчас есть период, когда на этом можно заработать, но уже появляются и будут появляться платформы, где все это как сервис предоставляется, то есть возможность и необходимость делать кастомные решения, она может пройти. Поэтому мы сейчас с этим работаем, но мы прекрасно понимаем, что в связи с тем, что через полгода этот сегмент может полностью закрыться, появится один или два сервиса, которые все это компенсируют, с подпиской, и наша работа тут будет закончена.

Но то, что касается обучения приватных моделей под конкретные задачи, в частности под классификацию или компьютерное зрение, это пока выглядит как довольно бесконечный сегмент, потому что несмотря на то, что есть куча решений, в том числе и опенсорсных, под сборку систем на основе компьютерного зрения, все равно под каждый уникальный сценарий, в каждом бизнесе это нужно кастомизировать, нужно обучать, нужно тестировать, и это нужно контролировать уже в процессе эксплуатации. Потому что нейросеть довольно быстро устаревает, если она не дообучается.

И здесь я вижу, как раз по работе будет объем, в России особенно, потому что многие решения западные нам сейчас становятся мало доступны. По разным причинам, и по финансовым, и по требованиям безопасности. Как можно встроить в контур какую-нибудь зарубежную апишку, обученную даже?

– Про что ты говоришь, когда озвучил, что нейросети довольно быстро устаревают?
– Устаревает эффект обучения со временем. Накапливаются ошибки, систему нужно дообучать или перебучать. Изменяется контекст данных.

Я приведу пример. Если ты обучил нейронку искать товары на маркетплейсе, по какому-то принципу, она отлично здесь справляется. Проходит 2-3 месяца, меняется контекст товарного предложения, она начинает работать все хуже. Ее нужно дообучать на более свежих данных. Таким образом, она будет планово развиваться. Ты выполняешь обучение, делаешь разметку данных, и с каждой итерацией у тебя повышается точность. То есть, это такая история на долгосрок.

В каждом проекте, который мы сейчас продаем, предусмотрен специальный комплекс систем, которые позволят заказчику продолжать размечать, и на размеченных данных запускать процесс переобучения нейронов.

Более того, у нас все модели версионируются, то есть вы можете в рамках одного проекта иметь целую историю различных моделей, каждая из которых обучена по определенной логике. Вы можете их сравнивать друг с другом, заменять, переобучать и выбирать наиболее удачные из них и продолжать работать с ними.

– Ты много об этом рассказываешь, видно, что тебя это увлекает. Интересно, ты сам работаешь с людьми или у тебя есть продакты?
У нас кастомно построен процесс поиска и валидации продуктов. Он не построен по методологии каст-девелопмента, каст-ресерча, лин-девелопмента. Мы отказались от всего этого. Мы все это пробовали.

Это очень хорошо, наверное, подходит, если вы четко понимаете, в какой нише вы работаете. Например, несколько недель, а может быть и месяцев, ресерчить конкретно одну тему и пытаться найти в ней какую-то нишу. У нас другой подход. Мы идем сразу продавать. Гипотезы берутся откуда угодно. Они берутся из входящих лидов. Они берутся из общения с текущими заказчиками. Они берутся просто с рынка. Я часто смотрю всякие разные стартап-демо, которые приходят в российские инкубаторы. Первое, что мы проверяем, это можем ли мы дешево дойти до клиента, который будет покупать. Это самый основополагающий принцип. То, как вы дойдете до покупателя, насколько вы можете прямо быстро проложить канал коммуникации и получить его доверие. Например, за счет рекомендации. Это решает очень много вопросов. Если этот этап пройден, мы знаем, как дойти до людей, которые покупают. Дальше мы обычно делаем первую версию.

Мы можем привлечь эксперта, который разбирается в теме, чтобы дополнить презентацию, если это необходимо. Если эксперты недоступны, мы можем сами что-то создать. Затем мы работаем в холодном аутриче, получаем новую информацию на звонках, перерабатываем ее и делаем следующую версию.

Кстати, я обратил внимание, что в отличие от заказной работы классической, я прямо спрашиваю, обычно уже на этапе пресейла, когда мы обсуждаем какое-то решение. Я предлагаю заказчику рассмотреть такой вариант, чтобы начать подбирать среди его конкурентов желающих пилотировать то же самое, возможно, даже по его рекомендации. Это позволит нам снизить стоимость разработки и быстрее собрать необходимый объем информации для составления датасетов для обучения. Я удивился, но это хорошо работает.

По опыту заказной разработки обычно привыкаешь к тому, что если ты пилишь приложение для Спартака, то ты точно не должен пилить приложение для Зенита, условно говоря.

В последнее время люди все больше готовы объединяться в консорциумы и решать коллективные задачи, связанные с машинным обучением. Например, в одном проекте три юриста работают с нами под одним контрактом, но при этом они конкуренты в одной сфере.

– Ну, и это понятно, потому что все новое, все боятся рисковать, тем более даже если это большая компания. Они всегда хотят посмотреть, как уже кто-то что-то сделал.

А если вообще нет таких решений на рынке, конечно, проще поговорить, объединиться, пропилотировать всю эту историю совместно. Вот про те же банки - ассоциация Fintech проводила конференцию, и банки сидели, обсуждали ипотеку в ИЖС, и они говорили: "давайте коллаборироваться, давайте вместе придумывать что-то, обмениваться данными, потому что никто не знает, может застройщики у вас уже накредитовались, а выполнят ли они проекты, под которые они у нас взяли кредиты?".
– Там такой кейс, но в машинном обучении такая история, чем больше данных, тем точнее будет вестись работа над процессами того же клиента, которому предлагается взгляд с разных сторон, в том числе с точки зрения конкурентов. Есть еще одна прикольная особенность в этой специфике. Модель, которую ты хорошо обучил и интегрируешь, которая, например, работает со свиньями, она очень хорошо будет работать как внутри РФ, так и вне РФ. Это для нас тоже очень интересно, потому что снижается зависимость от локального рынка.

– Круто, что ты так увлечен всем этим. Хотелось бы пожелать тебе успехов в этом направлении.
– Давай еще через пару месяцев созвонимся, я еще тебе расскажу.

– С удовольствием пообщаемся.

88