«Прорыв года в ИИ — это генеративные модели»

Старший управляющий директор Сбербанка Максим Ерёменко — о конференции AI Journey 2020, трендах в области искусственного интеллекта и об устройстве работы над ИИ в банке.

Материал подготовлен при поддержке Сбербанка

Завершилась международная конференция по искусственному интеллекту и анализу данных Artificial Intelligence Journey. Со стороны Сбербанка за организацию онлайн-мероприятия на 25 тысяч человек отвечал Максим Ерёменко — старший управляющий директор, директор управления развития компетенций по исследованию данных. Он рассказал, как прошла 100-часовая конференция, за какими трендами и компаниями стоит следить и как обстоят дела с искусственным интеллектом в самом Сбербанке.

Вы прямо зашли с козырей. Формат в этом году действительно был не такой, как в предыдущие. Нам, как и всем мероприятиям, пришлось перейти в онлайн. В этом оказались свои плюсы и минусы.

Минусы понятные: это ограниченность нетворкинга, недостаток живого общения. И технологическая сложность реализации, как это ни странно. Казалось бы, в онлайне всё должно быть проще. Но чтобы добавить интерактива, секции параллельных треков, воркшопы, стенды, буткемп — пришлось разрабатывать целую платформу. Это оказалось не самой простой задачей.

Среди плюсов онлайна — неограниченное количество участников. Нас посмотрели уже более 23 млн раз. Точное количество человек назвать сложно, но это около 8 млн зрителей.

И это люди самых разных возрастов. Например, на онлайн-соревнование по анализу данных и искусственному интеллекту, которое мы проводили в рамках конференции, четверть заявок мы получили от школьников. Мы способствовали этому сами — выделили отдельный трек докладов AI Journey Junior.

Самому молодому участнику соревнования было 9 лет, он из Ижевска. Этот парень уже два года занимается программированием на Scratch, сейчас переходит на Python. Впечатляюще. И самый взрослый участник AI Journey Contest тоже удивил — ему 72 года.

Всего мы получили 29 тысяч регистраций, почти 2,5 тысячи из-за рубежа. Очень популярна конференция оказалась в Индии — оттуда у нас почти 700 зарегистрировавшихся и более 1,75 млн просмотров. Мы хотели стать международными и популярными, у нас это получилось.

Было непросто всё организовать. Это далеко не первая такая конференция для меня, но впервые в таком масштабе, онлайн-формате и с участием трёх президентов: двух президентов стран — России и Казахстана — и президента Сбербанка.

Одна из задач — на распознавание рукописей Петра I, так называемой скорописи. Вторая — на прогнозирование уровней реки Амур: научиться своевременно реагировать на паводки и наводнения, которые ежегодно наносят экологический и финансовый ущерб России.

Ещё ребята готовили эссе для разных гуманитарных дисциплин: русского языка, литературы, обществознания и истории — с помощью нашей генеративной модели. В прошлом году участники тоже писали сочинение, но в этот раз было сразу несколько дисциплин.

Все задачи интересные. И особенно увлекательно было слушать обратную связь по решениям от тех, кто выступал на треках конференции.

Если честно, я отсматривал контент на этапе подготовки к конференции, поэтому посмотрел почти всё.

«Научный день» больше всего запомнился keynote-спикерами (основными докладчиками — прим. vc.ru). Выступали содиректор швейцарского Института исследований искусственного интеллекта Юрген Шмидхубер, глава подразделения исследований NVIDIA Анимашри Анандкумар, профессор Оксфордского университета Майкл Вулдридж, директор лаборатории нейроморфных исследований Intel Майк Дэвис, Йоша Бах из AI Foundation. Я не буду кого-то выделять, все доклады были крайне интересны.

Кадры выступления Юргена Шмидхубера, содиректора швейцарского Института исследований искусственного интеллекта

В этом году очень легко выделить общую идею в отрасли, в отличие от предыдущих лет. Год назад её было сложно сформулировать, а два года назад — вообще невозможно. Сейчас специалисты в области искусственного интеллекта и глубокого обучения активно обсуждают AGI (Artificial General Intelligence) — общий искусственный интеллект, или, как его ещё называют, сильный искусственный интеллект. Ещё три года назад все считали, что в ближайшие десять лет мы к таким обсуждениям даже не приблизимся.

Об общем искусственном интеллекте в своей речи высказался даже президент. Это больше не фантастика — область уже переходит в стадию первых, хотя ещё и фундаментальных, исследований.

Хотел бы подчеркнуть: скорость технологических изменений увеличилась в разы. Всего за несколько месяцев наша страна и весь мир прошли путь, который мог занять ранее годы, а может быть, даже десятилетия. На наших глазах технологии искусственного интеллекта, анализа больших данных меняют повседневные привычки, весь уклад жизни людей, открывают путь к яркому успеху компаний, конкретных людей, которые занимаются передовыми бизнес-моделями.
Владимир Путин на AI Journey 2020

Это первый тренд. Второй — дальнейшая демократизация технологий ИИ. Возраст аудитории виден не только по участникам соревнования — трансляции докладов тоже смотрели молодые специалисты. 70% всего трафика шло через «ВКонтакте», его пользователи в основном представляют молодёжный сегмент соцсетей.

Каждый четвёртый участник соревнования — школьник, а каждый третий зарегистрировавшийся на платформе — моложе 25 лет. Тема искусственного интеллекта становится популярной и массовой.

Третий тренд — это этика и этические принципы развития искусственного интеллекта. Общество по-прежнему боится, что ИИ нас всех заменит, поработит, лишит рабочих мест. Но пока ИИ только создаёт новые рабочие места и новые профессии.

В третий день конференции мы делали на эту тему коллаборацию с BlackStar. Мы хотели показать, что ИИ скорее помощник, а не противник человека — во всём, и в том числе в решении креативных задач.

Раньше, когда мы говорили об областях применения искусственного интеллекта, речь шла только о рутине — автоматизации действий, которые не доставляют нам удовольствия. Например, не каждому из нас захочется листать бумажную карту за рулём автомобиля для того, чтобы понять, как проехать. Навигатор справляется с этой задачей лучше. И естественно, он использует модели машинного обучения, персонализацию и адаптивность.

Мы этого просто не чувствуем — так же, как при выборе контента в музыкальном плеере или в онлайн-кинотеатре мы не задумываемся, почему нам предлагают конкретный фильм или трек.

В плане рутины ИИ уже можно сравнить с чем-то обыденным вроде электричества.

Коллаборация с селебрити, которую мы показали в третий день конференции, — это только первый подход к снаряду. Но я почти уверен, что через три, пять или семь лет индустрия медиа, кино, музыкального продакшена будет основана на ИИ так же, как сегодня наша дорога от дома до работы основана на использовании навигатора в телефоне. Это не хорошо и не плохо. Это просто меняет наш образ жизни.

Да, у нас есть внутренний этический документ. И я думаю, что в начале следующего года мы сделаем его публичным. Примерно такие же программные документы есть у других технологических компаний — Microsoft, Google. Все говорят примерно об одном и том же наборе принципов.

Во-первых, это применение искусственного интеллекта во благо, а не во зло.

Это интерпретируемость: технологии не должны выйти из-под контроля, а для этого нужно хорошо понимать, как они работают.

Это принципы недискриминации: мы не можем ограничивать определённые группы клиентов просто потому, что у них какие-то показатели выглядят иначе, чем у других.

Есть также принцип устойчивости. Если модели, которые используются для принятия решений и кастомизации продуктов, начинают вести себя аномально, должна быть возможность это пресечь.

Общий принцип такой: технологии искусственного интеллекта должны помогать людям принимать решения, оптимизировать время и повышать качество жизни. И не представлять угрозы.

Здесь тоже без новостей, лидеры всё те же — технологические компании, которые именуются акронимом FAANG в Америке и BAT в Китае. Это Facebook, Apple, Amazon Web Services, Netflix, Google. К ним я добавил бы Microsoft.

Если говорить про китайские, то в первую очередь Huawei, Tencent, Baidu и Alibaba. С точки зрения искусственного интеллекта в последние несколько лет можно отметить прогресс именно Tencent и Huawei. С последними мы активно проводим некоторые совместные исследования и видим их немножечко изнутри. И эта команда одна из сильнейших в мире по ИИ.

В Европе есть более или менее индустриальные команды в институтах. Самая мощная европейская компания — DeepMind, дочка Google, которая активно занимается биологическими архитектурами нейронных сетей и обучением с подкреплением.

Я считаю, что это генеративные модели. Команда OpenAI в мае выпустила генеративный языковой трансформер GPT-3. Он доступен проприетарно за деньги от OpenAI — на английском языке.

Мы тоже занимаемся генеративными моделями. Понятно, что для русскоязычного текстового контента делать их сложнее, потому что его в глобальной сети значительно меньше, чем англоязычного. На одном из треков соревнований участники «прокачивали» модель GPT-3 для русского языка — ruGPT-3. Мы будем распространять её не проприетарно, а бесплатно, — как минимум в исследовательских и образовательных целях.

Если говорить про прикладную область, то в этом году мы увидели очень большое количество сервисов и приложений, работающих на основе технологии deepfake. К счастью, пока она бешено популярна только в индустрии развлечений — будем надеяться, что так это и останется. Современный уровень систем машинного зрения позволяет получать достаточно фото- и видеорелистичные картинки.

Мы тоже не сидели на месте. На прошлой AI Journey мы презентовали самый мощный суперкомпьютер в стране, а в этом году — набор продуктов для работы с ним. Часть сервисов из этого набора не имеет аналогов.

Также мы показали библиотеку автоматизированного машинного обучения и генеративную модель ruGPT-3. Пока она использует 760 млн параметров, но весной мы покажем следующее поколение с существенно большим их количеством. Будет что-то вроде той самой GPT-3 от OpenAI.

В Сбере команды дата-сайентистов и инженеров данных федерализованы, то есть нет централизованных структур. В каждом бизнес-направлении, в каждой продуктовой команде есть набор ролей: дата-сайентисты, дата-инженеры, ML-инженеры.

90% специалистов по работе с данными Сбере трудятся именно в agile-командах. Централизация тоже есть, например, в лаборатории искусственного интеллекта, в которой команды работают над более глубоким R&D, хотя и всё ещё прикладным.

Важно не забывать, что дата-сайентист — прежде всего scientist, поэтому у нас есть KPI на R&D. Мы внедряем инновации с фокусом на то, как улучшить процессы с помощью новых методов, а не опираться на устоявшийся инструментарий.

У нас есть внутренний KPI на «опромышливание» — индустриализацию того, что делает R&D-команда в лаборатории искусственного интеллекта.

Понятно, что у дата-сайентистов, которые работают внутри продуктовых команд, доля science значительно меньше, чем у разработчиков в лаборатории, но тем не менее все они занимаются не только разработкой, но и исследованиями. В лабораториях больше, в продуктах меньше.

Наверное, сейчас в Сбере нет задач, в которых не применяется анализ данных. Мы поставили себе цель: до 2022 года 100% процессов и продуктов должны использовать искусственный интеллект. В большинстве случаев это экономически оправдано или позволяет поднять клиентский опыт на недоступный ранее уровень.

В этом году мы открываем Институт искусственного интеллекта, в котором будем проводить фундаментальные исследования. Сейчас мы не можем себе позволить исследования уровня DeepMind или Google: внутри Сбера у каждого продукта должен быть «спонсор». Это может быть гипотетически CEO организации или один из его первых замов. Понятно, что к CEO организации бегать каждый раз невозможно. Поэтому решили открыть институт для расширения объёма фундаментальных R&D.

Уже практически не существует рабочих мест или людей без доступа к интернету. Через телефон, планшет, десктоп — доступ есть у всех. Дальше появляется 5G. Даже 10 лет назад скорость передачи данных через мобильный интернет была существенно ограничена, а сейчас мы легко общаемся в Zoom. То же самое происходит и с ИИ. Пока мы более или менее научились автоматизировать рутину.

Дальше — не рутина. Чем сложнее задачи, тем более сложные когнитивные способности требуются для их решения. Это касается и работы топ-менеджеров. Для них сейчас мы разрабатываем интеллектуальную систему управления. Она называется Digital Manager и использует NLP, граф знаний и машинную оценку когнитивных искажений — при одних и тех же вводных человек в разных настроениях может принимать разные решения.

Ещё дальше — то, что называется «нейро-AGI». Это узконаправленный сильный искусственный интеллект, который может переобучаться на лету или использовать модели и алгоритмы, обученные в задачах одного класса, для решения задач другого класса. Я думаю, что в этой области в ближайшие пять-семь лет случится прорыв.

Многие считают, что не стоит ждать появления AGI ещё лет 50, но взгляните хотя бы на тот же генеративный трансформер. Тексты, которые он пишет, не идеальны, но в сочетании с качественными, хорошо развитыми системами, мощным суперкомпьютером под капотом и выстроенными бизнес-процессами такие модели могут в ближайшие несколько лет автоматизировать достаточно сложный набор действий, например разбор нашей почты.

И такие эксперименты уже есть. Даже циркулирующую между топ-менеджерами почту уже мог бы разобрать алгоритм — и сгенерировать ответы не хуже них самих.

«Прорыв года в ИИ — это генеративные модели»

Начнём с прошедшей конференции. Всё ли удалось в этом году? Как и многим, вам пришлось изменить формат из-за пандемии?

Какие задачи решали участники онлайн-соревнования?

На AI Journey прошло более 200 докладов. Удалось ли вам посмотреть все, которые хотелось? Какие больше всего запомнились?

Какие тренды обсуждали?

На что сейчас способен ИИ в плане креативности?

В Сбере есть свои правила по работе с искусственным интеллектом?

Если говорить в целом о сфере, какие команды и проекты вы считаете наиболее интересными?

Чтобы вы назвали главным событием или прорывом в отрасли за прошедший год?

Что нового у этом году у ИИ в «Сбере»?

Поговорим про устройство вашего направления в Сбере. Над какими задачами работает команда, насколько она большая?

А что после 2022 года? Какой путь искусственного интеллекта в компании дальше?