Как подружить бизнес-подразделения и дата-сайентистов

И зачем топ-менеджерам учиться писать код

Особенностью нового сезона стала XR-студия, разработанная командой Sber AR/VR Lab специально для подкаста «Три запятые»
Особенностью нового сезона стала XR-студия, разработанная командой Sber AR/VR Lab специально для подкаста «Три запятые»

Венчурный хаб SberUnity запустил второй сезон видеоподкаста для ИТ-стартапов «Три запятые». Гостем первого эпизода стал первый зампред правления Сбербанка Александр Ведяхин. Он рассказал, в каких нишах в корпорациях сейчас есть спрос на технологические решения, как Сбер работает со стартапами и как повысить эффективность бизнеса с помощью искусственного интеллекта.

Видеоверсию разговора можно посмотреть по ссылке. Ниже — текстовая версия интервью.

Александр Ведяхин
Первый заместитель председателя правления «Сбербанка» 

— Как вы считаете, искусственный интеллект в последнее время набирает обороты в России и в мире? Расскажите своё видение: какие вы видите ключевые тенденции в сфере ИИ?

— Дам несколько цифр. Если применять ИИ к любому процессу, эффективность увеличивается в 5–7 раз. Даже если мы говорим о простом искусственном интеллекте. Что такое увеличение эффективности? Увеличение дохода, увеличение клиентского потока. Когда стартап думает, применять ему ИИ или нет, просто подумайте про эти магические цифры. Если технологии уже достаточно продвинутые на предприятии, рост будет в 2–3 раза, но всё равно это кратный рост эффективности.

В США 60% стартапов связывают свой успех с искусственным интеллектом. В России — 20%.

Смотрим, сколько единорогов в США, сколько в России. Разный рынок — разные потребности, это понятно. Но, возможно, это причина, почему в США такое количество единорогов.

— А что препятствует этому на рынке России и СНГ?

— Всё начинается с желания. Когда фаундеры думают, как бы им сделать что-то новое, первое, о чём нужно подумать, — ИИ. В ИИ нет ничего сложного, это простая математика. Причём я знаю людей, которые не дружили с математикой в школе, но стали успешными дата-сайентистами. Есть большое количество готовых библиотек. Возникла идея — скачали библиотеку — попробовали. В целом, никаких сложностей, главное — мотивация. В интернете множество курсов, которые можно пройти. Например, от Сбера, от «Яндекса».

Дальше возникает вопрос компьютерных мощностей. Что здесь можно порекомендовать? Первое — нужно попробовать не очень большие алгоритмы, чтобы они могли крутиться на одной графической карте, на одной машине. Если это не получается, арендуйте место в облаке. Цена 1 минуты вычисления в нашем облаке — от 3 до 5 рублей.

Ещё один ограничивающий фактор — люди. Дата-сайентисты даже среднего уровня стоят очень хороших денег. Их скупают корпорации, но много ситуаций, когда из корпорации люди уходят в стартап. Сложно заплатить больше, однако можно увлечь. Да и элементарно даже если в вашей команде все пройдут курсы — уже вы станете мидл-грейд-специалистами. И этого уже достаточно, чтобы тестировать бизнес-идею.

— Вот вы привлекаете дата-сайентиста. Он может быть хорошим математиком, разбираться в программировании, но при этом он не знает бизнес-процессы. Как это совместить?

— У нас была такая проблема 3 года назад. Вылечили мы её следующим образом. Первое — всех специалистов по бизнесу (маркетинг и так далее) мы мотивировали, в широком смысле этого слова, чтобы они прошли обучение ИИ. Начали мы с обучения членов правления банка. Они ездили в MIT, дальше они проходили курсы внутри Сбера: они кодировали, писали сети. И пока руководители не сделают это своими руками, они не поймут, как это работает.

Они решали конкретные задачи. Например, тема — увеличение одобрения при стандартном риске. То есть как больше выдать и как больше вернуть. Каждый взял своё направление и решал задачу.

Сначала обучался топ-менеджмент, потом мидл-менеджмент и так далее. Все люди, которые у нас ставят задачи, прошли обучение ИИ. Вообще в Сбере обучение ИИ прошло более 50 000 человек. Поэтому теперь, когда бизнес ставит задачу, он понимает, о чём идёт речь. В принципе он и сам может закодировать, но что-то такое среднее, однако нам нужные самые сильные решения, поэтому мы привлекаем дата-сайентистов. Но их мы привлекаем в команду: он не просто исполнитель. Они у нас работают в подразделениях и чётко знают бизнес-процессы.

Если нужно что-то отдельное, особое, мы привлекаем нашу Лабораторию по искусственному интеллекту. Это уже такой research. Если и это не получается (например, очень большая задача), то привлекаем нашего научного партнёра - Институт искусственного интеллекта AIRI. Там уже исследования с длинным треком. Всё решается тотальным обучением и практикой.

— У Сбера много подразделений и внутренних стартапов. Как с точки зрения такой позиции Сбер смотрит на внешних участников, на внешние стартапы? Готовы ли вы их привлекать?

— Вы знаете, что готовы. На примере даже вашего стартапа. Короткий ответ: мы готовы (Прим. ред. — Стартап Andata является выпускником акселератора Сбера, он провёл ряд пилотов с различными подразделениями компании и получил контракт). Но в чём бывают сложности? Первое — нужно понимать спрос со стороны большой корпорации. Мой совет: конкретнее понимать общий нишевой спрос, что конкретно вы решаете. У каждой корпорации есть какая-то нерешённая задача, и на неё мы, конечно, готовы привлекать внешние проекты.

Кстати, порядка 50% неудач стартапов связаны с тем, что их продукт оказывается не востребован. Классическая история: приходит стартап и говорит, что у нас супермегакрутой продукт. Мы смотрим, и зачастую получается так: либо у нас уже это есть, либо продукт не очень готов.

Важно понять нишу, начать общаться, подстраивать своё решение. Ну и, конечно, с большими корпорациями сложности в том, что у нас работает много людей, длинный цикл принятия решений. Те стартапы, которые с нами работают… У них отличительная черта — фаундер, который готов и хочет общаться с основными людьми, принимающими решения внутри корпорации.

— У Amazon есть внутри направление, которое занимается тем, что собирает с корпораций запросы, а с другой стороны, собирает стартапы, рассылает им некие предложения, проводит оценку и так далее. А далее уже корпорации и стартапы между собой стыкует. Как в этом направлении работает Сбер?

— У нас есть площадка, которая называется SberUnity. Там уже 1350+ стартапов, и мы наших корпоративных клиентов туда тоже направляем. Рекомендуем им смотреть и искать стартапы там. Это активно развивается, и я думаю, что это первый подход к такому маркетплейсу, где и стартап может себя показать и где есть спрос, есть предложение. Например, на SberUnity есть такой раздел — импортозамещение. В последнее время он становится очень актуальным. Там больше 200 компаний, которые дают решения, как заменить ПО, или решения зарубежные, тех компаний, которые покинули Россию.

— Вы как Сбер там публикуете запросы?

— Да. На самом деле, ситуация уникальная. Если раньше большие корпорации могли сказать, что возьмут то или иное зарубежное решение, то сейчас эти возможности закрыты. Китай — сложная тема. Индия — тоже, ну неочевидные вещи.

Поэтому ребята, которые предложат решения, заменяющие зарубежные аналоги, получат открытое окно больших возможностей, это сейчас всем корпорациям надо, все это хотят.

Сейчас даже законы есть, чтобы в каждой корпорации было определённое количество российского ПО. Вот где реально сейчас можно стать единорогом.

А что вы скажете про такие решения в России, которые условно называют экосистемами в области данных. Например, у Сбера большое количество данных, большое количество подразделений. Как с этой точки зрения стартапу встроиться в работу с экосистемами, есть ли у них шансы?

Во-первых, я думаю, что конкуренция экосистем продолжится, и это очень продуктивно. И для экономики, и для стартапов. Конкуренция заставляет большие (и обычно неповоротливые) компании двигаться с максимальной скоростью. Поэтому стартапы за счёт этого становятся интереснее для корпораций. Просто потому, что, если, например, «Яндекс» делает что-то классное, у другой корпорации какие варианты? а) Купить команду, которая делает там. Обычно это дорого, тяжело, сложно. б) Растить у себя эту компетенцию. А иногда этого просто нет: не из кого растить. Поэтому можно либо «купить» людей, которые на рынке этим занимаются, либо купить стартап, который этим занимается. В общем-то у нас есть и такие, и такие примеры.

Что касается данных, то есть датасеты обезличенных данных. В России есть федеральный проект, который называется «Искусственный интеллект». Там теме датасетов посвящена отдельная глава.

Есть перспективное направление для развития ИИ — сельское хозяйство. После финтеха и телекоммуникаций это, наверное, наиболее интересное направление по эффективности применения ИИ. Там свои наборы данных.

Важно понимать, что у нас очень жёсткое регулирование именно персональных данных, поэтому чтобы стартап получил доступ к этим данным, он должен либо стать частью корпорации, либо работать на обезличенных данных.

Сейчас есть несколько решений, которые позволяют работать с эмуляцией. Например, я хочу себе представить, каким образом выглядят клиенты Сбера. Это будут не реальные данные (Сбер вообще может ничего не давать), но я увижу условного Иванова Ивана Ивановича.

— А что вы думаете об этике? Человек оставляет большое количество цифровых следов: телефон, почта и так далее. При объединении этих данных в профиль пользователя можно с высокой степенью вероятности предсказывать определённые действия по индивиду или по группе. Где здесь та самая граница этичности для применения ИИ?

— На мой взгляд, это должен решать сам индивид. Кто-то говорит: я готов раскрыть своей системе свои данные, но зато я буду получать лучшее предложение, лучшую рекомендацию по фильму, лучшие цены на мои любимые продукты и так далее. Другой человек говорит: нет, слушайте, я как-нибудь сам разберусь, никому своих данных не дам, пожалуйста, меня не трогайте. Это должен решать сам человек, потому что он владелец своих цифровых данных.

Этика ИИ — это чуть более широкое направление. Оно связано с тем, как сделать так, чтобы ИИ не навредил человеку.

— Как Россия с точки зрения этики, работы с персональными данными выглядит относительно остального мира?

— Сделаем чуть шаг назад. Почему ИИ сильно развивается в США и Китае, но плохо развивается в Европе? Ответ простой: регулирование. В Европе настолько тяжёлая, сложная и опасная для предпринимателя система регулирования, что там есть штрафы за несоблюдение даже каких-то незначительных аспектов относительно персональных данных. И штрафы не от прибыли, а от оборота компании. И, конечно, все компании стараются действовать максимально выверено. Прежде чем сделать датасет, должны дать заключение юристы, комплаенс, внутренний аудит и так далее. И это очень тяжело.

В США среднее регулирование, там всё активно развивается. В Китае резкое развитие ИИ связано с тем, что там регулирование очень государственно ориентированное. При этом таких штрафов и жёстких санкций за работу с персональными данными нет.

Каждый регион мира выбирает свою модель. Мы, на самом деле, где-то между Европой и Китаем. То есть у нас велика роль государства, достаточно жёсткие требования к персональным данным (что, на мой взгляд, справедливо), но всё же мы не такие жёсткие, как Европа. Поэтому данные в России в полностью обезличенном виде могут быть доступны, на них можно обучать модели — это хорошие новости.

— То есть для стартапов неизбежна коллаборация с каким-то крупным поставщиком данных, если он хочет в этом направлении развиваться?

— Конечно. Иначе это не работает. Можно придумать себе какую угодно интересную идею, но она всегда должна быть проверена на данных. Если этих данных нет, идея может быть прекрасной, хорошей, но не работающей. Или, наоборот, в этих данных можно найти ещё какую-то новую идею.

— Суперкомпьютеры. «Яндекс» запустил, вроде, два суперкомпьютера. Сбер использует «Christofari» и «Christofari Neo». Для чего эти супермашины вы планируете использовать?

— Первое — это резкое увеличение скорости вычислений. У нас уже очень большие объёмные модели. Допустим, сейчас мы работаем над нейросетью, у которой будет порядка 600 млрд связей. На «Christofari» она будет считаться от 6 до 9 месяцев. Если бы «Christofari» не было, посчитать было бы в принципе нельзя.

Зачем нужны эти сети? Мы увидели очень интересный феномен. Если сетка одновременно учится на разных задачах, умеет решать разные задачи (так называемая мультимодальность) — рассчитывать кредитный скоринг, рисовать картинки, понимать речь и так далее, — то такая сеть сможет решать порядка 800 задач одновременно. Интересным образом производительное решение каждой задачи улучшается. Мы увидели, что коэффициент Джини для сетки, которая творческая, умеет рисовать — плюс 10%. Это многие миллиарды рублей. Одно это делает создание суперкомпьютера экономически оправданным.

А теперь про стартапы. Как я уже говорил, время на суперкомпьютерах для стартапов реально дёшево (3–5 рублей за минуту). Более того, мы даём гранты. До 180 000 рублей на старте. Можно зайти, попробовать, посчитать. Опять же, используемый нами суперкомпьютер находится не просто «где-то», и к нему надо ехать. Нет, это облачное решение. К нему можно подключиться со своей рабочей станции, использовать эти мощности. Более того, доступно супермаркет-решение, которое можно и к себе загружать, ML Space, где уже лежат хорошие алгоритмы. Их оттуда можно бесплатно скачивать, использовать. Туда же загружать эти данные, делать внедрение модели сразу же. Тут же приглашать потенциальных партнёров, показывать им, как это работает.

В облаке значительно проще решаются вопросы с данными, так как сам по себе это защищённое пространство. Стартап работает с этими данными по NDA, поэтому он ничего с ними сделать не сможет, их невозможно скачать себе на компьютер и потом делать с ними что-то непонятное. Поэтому у облака и суперкомпьютера очень и очень много плюсов.

— Дайте совет в области монетизации. При создании любого решения нужно объяснить экономическую выгоду покупателю. А решение стартапа не может изначально говорить только о том, что мы вам точность, скорость повысим или что-то ещё. Мы не знаем, сколько вы на этом заработаете. Как здесь найти баланс?

— Если стартапу говорить «расскажите нам, сколько вы сэкономите нам денег», это очень сложно, потому что стартапу нужно понимать, каким образом мы внутри Сбера осуществляем расчёт экономии денег. Поверьте, это очень нетривиальная история, потому что у нас есть постоянные, переменные издержки, множество факторов, всё по-разному считается. Есть специальный департамент, который за это отвечает.

Требовать от стартапа «расскажите нам, сколько вы нам сэкономите» лишено смысла. Поэтому мы даём стартапам конкретные параметры: увеличьте скорость, улучшите точность и так далее. То, о чём вы говорили. Это понятные, конкретные параметры, которые мы потом сами монетизируем. Мы сами знаем, что они значат для нас в деньгах. Я бы стартапам рекомендовал презентовать вот такие чёткие, конкретные показатели, за которые они могут нести ответственность.

— Могли бы вы со своей стороны подсказать, есть ли у вас направление, в рамках которого вы конфигурируете работу со стартапами по так называемому фаст-треку?

— У нас есть линейка акселераторов, из которых и открывается эта дверь. Работа со стартапами требует от организации внутренних ресурсов. И организация тоже находится в постоянном дефиците этих ресурсов. Если стартап будет неэффективным (мы вложили ресурсы и не получили отдачу), это демотивирует на работу со стартапами в дальнейшем. Поэтому мы проводим стартапы через наш корпоративный акселератор, смотрим, кто как работает. Пока что в эту дверь сложно проходить, там длинный коридор, чтобы идти, но мы работаем над тем, чтобы он стал короче.

При этом здесь тоже важно управлять ожиданиями. Работа с любой большой корпорацией — это всегда длинная дорога. Но фаст-трек нужен всем, и мы над этим работаем. Кстати, если возвращаться к диалогу про конкуренции экосистем, корпорации точно будут ускорять трек, он будет дорабатываться во всех компаниях.

— С точки зрения глобальной конъюнктуры, есть ли сейчас у российских стартапов глобальные возможности на других рынках?

— Давайте поговорим про закрытость или открытость рынка. Да, для нас сейчас закрылись рынки США, более широко — Северной Америки. А также закрылись рынки Европы, вернее, на них стало намного сложнее попасть. Но давайте посмотрим на рынок Ближнего Востока, Персидский залив, Катар, Арабские Эмираты, Саудовская Аравия — страны с большим денежным ресурсом, с небольшим количеством человеческого потенциала (натурально, там мало людей), при этом с большим желанием, пониманием и технологическими стратегиями. У них есть прямо жажда и желание работать именно с российскими стартапами.

Китай — очень закрытый рынок, на мой взгляд. Вот там прямо сложно, жёсткая конкуренция, хотя попробовать можно всегда. Индия — очень интересный рынок, где много людей, много денег, эффект масштаба. Почему все шли в США? Потому что эффект масштаба. Сделал что-то удачное — умножил на 250 млн в среднем богатых людей — и у тебя единорог. Слушайте, там своих желающих очень много. Давайте посмотрим туда, где тоже есть эффект масштаба, экономика растёт и доходы в целом уже сейчас хорошие.

Смотрим дальше — Малайзия и так далее. Страны, в которых тоже живёт более 100 млн человек. Это тоже большой рынок, мы просто про них не думали. Южная Америка — это кажется далеко, но если ты технологический стартап, то окей, это не есть проблема. Посмотрим на рынок Южной Америки — та же Бразилия. Кстати, рынок очень похож на российский — и по менталитету, и по бизнес-подходам, и по готовности двигаться вперёд.

Говорить о том, что всё пропало — ну конечно нет.

Есть географии, которые пока что (пока что!) нас не очень видят. А главное, где есть и люди, и деньги. Ну а российское правительство как помогало, так и будет помогать развиваться искусственному интеллекту, технологическим стартапам — сейчас в это очень много вкладывается.

— Кроме рынков есть ещё сложность, связанная с монетизацией. Именно с юридической точки зрения, движением денег и так далее. Сейчас инвесторы смотрят в сторону стартапов, которые монетизируют денежный поток, зарабатывают деньги. Что сейчас делается или может делаться в России, чтобы такая конструкция выстроилась? Чтобы можно было сделать публичную компанию со значимой капитализацией на каком-то альтернативном рынке — это может быть и Московская биржа, почему нет.

— Первое — Россия не закрывала свой рынок. Инвестиции ограничены, но это опять же вопрос про нахождение нового баланса. То есть мы всё равно находимся в глобальном рынке. Есть сложности с долларами и евро, но с другими-то валютами проблем нет.

Когда экономика генерирует деньги (а российская экономика в любом случае — это машина, которая генерирует деньги), всё равно есть денежные потоки.

Во многом сейчас эти деньги будут оставаться внутри страны, нужны будут цели для инвестиций.

Уже перебрали все голубые фишки, которые у нас есть, и нужны новые яркие лидеры рынка, которые дадут инвестору доходность.

Поэтому я считаю, что сейчас хорошее время именно для компаний среднего уровня зрелости, которые прошли уже некоторые этапы, думают, что они готовы к IPO или будут готовы к IPO, то следующие 2–3 года — это будет прямо реально момент. То есть будет время, когда будет спрос и нужно будет предложение.

У стартапов есть 2–3 года, чтобы подрасти к началу активного инвестиционного цикла в России. Нужно выбрать нишу. Интересной видится ниша замещения технологических решений, которые уходят и становятся недоступными, а на них уже есть яркий спрос. Заходишь в эту нишу — делаешь решение — параллельно общаешься с корпорацией — проходит вот этот «тёмный коридор» до начала инвестиций — и как только у вас есть один контракт, тут же скопом появляются другие контракты.

— В завершение нашей беседы могли бы подсказать с точки зрения своего жизненного опыта сериалы и книжки про искусственный интеллект, которые вам понравились?

— Заходите в интернет-магазине, смотрите книги про искусственный интеллект и выбираете то, что вас цепляет. Лайфхак: читайте первые 50, максимум 100 листов — если вас зацепило, читайте дальше. Если не зацепило, не тратьте свое время: откладываете книгу, берёте другую. Таким образом за месяц вполне реально прорабатывать 3–4 книги. Уже через 3–4 месяца в вашей голове будет чёткая конструкция, и дальше вы будете готовы к каким-то правильным курсам по обучению искусственному интеллекту.

Берёте онлайн-площадки и проходите курсы. Не надо сразу брать курсы типа «Python для продвинутых». Ваша задача — просто понять, как это работает, и попробовать свои навыки. Если вы фаундер, вы с минимальной долей вероятности сядете сами кодировать. Попробуйте для себя, чтобы вам лапшу на уши не вешали, что якобы это долго, тяжело и стоит больших денег. И потом найдите людей, которые будут это профессионально делать. Если вы умеете это делать сами, вы на интервью выберете правильных людей.

Таким образом, за полгода вы выйдете в такого профессионала среднего уровня. А потом у вас будут появляться идеи, и первое, что вы должны будете делать, — думать, как здесь можно применить искусственный интеллект. Такое упражнение даже для вас: есть идея — подумайте, как это сделать с помощью ИИ. Никак? Неверно. Сделайте несколько кейсов в голове, но не влюбляйтесь в первый.

— И последний вопрос. Как с вашей точки зрения фаундерам получить три запятые на счёте?

— Первое — иметь чёткую проверенную бизнес-идею. Это кажется очевидным, но, как уже сказал, половина неудач связана с тем, что продукт просто никому не нужен. Проверена бизнес-идея — значит подтверждён спрос.

Второе — нужно быть специалистом в этой области. Не бывает такого: я решил делать оборудование для сада и огорода, но ни разу не занимался садом и огородом. Если вы не специалист — станьте им.

Третье — важно уметь коммуницировать.

Умный хороший фаундер, не умеющий коммуницировать, ничего не добьётся.

Четвёртое — упорство. Даже если очень тяжело, нужно идти вперёд. Под упорством я понимаю отсутствие страха ошибки. Те фаундеры, которые имели ошибки, фейлы в бизнесе, на 20% успешнее тех, кто этих ошибок не имел. Не бойтесь! Упали — поднимайтесь. Это значит, вы стали на 20% успешнее.

Пятое — я искренне желаю всем удачи, потому что она очень и очень нужна.

44
9 комментариев

Так это у нас стартапы не используют data science потому что не хотят! А я то думал потому что нужны большие данные и вычислительные мощности...

9

А я то думал потому что нужны большие данные и вычислительные мощности...

Всё это копейки по сравнению с расходами на квалифицированный персонал. Причем речь не только про дата-сайентистов. Им же кто-то достаточно продвинутый от бизнеса должен внятно задачи поставить

— Дам несколько цифр. Если применять ИИ к любому процессу, эффективность увеличивается в 5–7 раз.

Понятненько

4

Я после этих строк и перестал читать)

1

*Говорить про важность коммуникации*
*Вместо выстраивания эффективной коммуникации отправлять топ менеджмент учиться руками ковырять код*

2

С сайентологами сложно дружить, они себе на уме