«Прорыв года в ИИ — это генеративные модели»

Старший управляющий директор Сбербанка Максим Ерёменко — о конференции AI Journey 2020, трендах в области искусственного интеллекта и об устройстве работы над ИИ в банке.

Материал подготовлен при поддержке Сбербанка

Завершилась международная конференция по искусственному интеллекту и анализу данных Artificial Intelligence Journey. Со стороны Сбербанка за организацию онлайн-мероприятия на 25 тысяч человек отвечал Максим Ерёменко — старший управляющий директор, директор управления развития компетенций по исследованию данных. Он рассказал, как прошла 100-часовая конференция, за какими трендами и компаниями стоит следить и как обстоят дела с искусственным интеллектом в самом Сбербанке.

Начнём с прошедшей конференции. Всё ли удалось в этом году? Как и многим, вам пришлось изменить формат из-за пандемии?

Вы прямо зашли с козырей. Формат в этом году действительно был не такой, как в предыдущие. Нам, как и всем мероприятиям, пришлось перейти в онлайн. В этом оказались свои плюсы и минусы.

Минусы понятные: это ограниченность нетворкинга, недостаток живого общения. И технологическая сложность реализации, как это ни странно. Казалось бы, в онлайне всё должно быть проще. Но чтобы добавить интерактива, секции параллельных треков, воркшопы, стенды, буткемп — пришлось разрабатывать целую платформу. Это оказалось не самой простой задачей.

Среди плюсов онлайна — неограниченное количество участников. Нас посмотрели уже более 23 млн раз. Точное количество человек назвать сложно, но это около 8 млн зрителей.

И это люди самых разных возрастов. Например, на онлайн-соревнование по анализу данных и искусственному интеллекту, которое мы проводили в рамках конференции, четверть заявок мы получили от школьников. Мы способствовали этому сами — выделили отдельный трек докладов AI Journey Junior.

Самому молодому участнику соревнования было 9 лет, он из Ижевска. Этот парень уже два года занимается программированием на Scratch, сейчас переходит на Python. Впечатляюще. И самый взрослый участник AI Journey Contest тоже удивил — ему 72 года.

Всего мы получили 29 тысяч регистраций, почти 2,5 тысячи из-за рубежа. Очень популярна конференция оказалась в Индии — оттуда у нас почти 700 зарегистрировавшихся и более 1,75 млн просмотров. Мы хотели стать международными и популярными, у нас это получилось.

«Закулисье» конференции AI Journey

Было непросто всё организовать. Это далеко не первая такая конференция для меня, но впервые в таком масштабе, онлайн-формате и с участием трёх президентов: двух президентов стран — России и Казахстана — и президента Сбербанка.

Какие задачи решали участники онлайн-соревнования?

Одна из задач — на распознавание рукописей Петра I, так называемой скорописи. Вторая — на прогнозирование уровней реки Амур: научиться своевременно реагировать на паводки и наводнения, которые ежегодно наносят экологический и финансовый ущерб России.

Ещё ребята готовили эссе для разных гуманитарных дисциплин: русского языка, литературы, обществознания и истории — с помощью нашей генеративной модели. В прошлом году участники тоже писали сочинение, но в этот раз было сразу несколько дисциплин.

Все задачи интересные. И особенно увлекательно было слушать обратную связь по решениям от тех, кто выступал на треках конференции.

На AI Journey прошло более 200 докладов. Удалось ли вам посмотреть все, которые хотелось? Какие больше всего запомнились?

Если честно, я отсматривал контент на этапе подготовки к конференции, поэтому посмотрел почти всё.

«Научный день» больше всего запомнился keynote-спикерами (основными докладчиками — прим. vc.ru). Выступали содиректор швейцарского Института исследований искусственного интеллекта Юрген Шмидхубер, глава подразделения исследований NVIDIA Анимашри Анандкумар, профессор Оксфордского университета Майкл Вулдридж, директор лаборатории нейроморфных исследований Intel Майк Дэвис, Йоша Бах из AI Foundation. Я не буду кого-то выделять, все доклады были крайне интересны.

Кадры выступления Юргена Шмидхубера, содиректора швейцарского Института исследований искусственного интеллекта

Какие тренды обсуждали?

В этом году очень легко выделить общую идею в отрасли, в отличие от предыдущих лет. Год назад её было сложно сформулировать, а два года назад — вообще невозможно. Сейчас специалисты в области искусственного интеллекта и глубокого обучения активно обсуждают AGI (Artificial General Intelligence) — общий искусственный интеллект, или, как его ещё называют, сильный искусственный интеллект. Ещё три года назад все считали, что в ближайшие десять лет мы к таким обсуждениям даже не приблизимся.

Об общем искусственном интеллекте в своей речи высказался даже президент. Это больше не фантастика — область уже переходит в стадию первых, хотя ещё и фундаментальных, исследований.

Хотел бы подчеркнуть: скорость технологических изменений увеличилась в разы. Всего за несколько месяцев наша страна и весь мир прошли путь, который мог занять ранее годы, а может быть, даже десятилетия. На наших глазах технологии искусственного интеллекта, анализа больших данных меняют повседневные привычки, весь уклад жизни людей, открывают путь к яркому успеху компаний, конкретных людей, которые занимаются передовыми бизнес-моделями.

Владимир Путин на AI Journey 2020

Это первый тренд. Второй — дальнейшая демократизация технологий ИИ. Возраст аудитории виден не только по участникам соревнования — трансляции докладов тоже смотрели молодые специалисты. 70% всего трафика шло через «ВКонтакте», его пользователи в основном представляют молодёжный сегмент соцсетей.

Каждый четвёртый участник соревнования — школьник, а каждый третий зарегистрировавшийся на платформе — моложе 25 лет. Тема искусственного интеллекта становится популярной и массовой.

Третий тренд — это этика и этические принципы развития искусственного интеллекта. Общество по-прежнему боится, что ИИ нас всех заменит, поработит, лишит рабочих мест. Но пока ИИ только создаёт новые рабочие места и новые профессии.

В третий день конференции мы делали на эту тему коллаборацию с BlackStar. Мы хотели показать, что ИИ скорее помощник, а не противник человека — во всём, и в том числе в решении креативных задач.

На что сейчас способен ИИ в плане креативности?

Раньше, когда мы говорили об областях применения искусственного интеллекта, речь шла только о рутине — автоматизации действий, которые не доставляют нам удовольствия. Например, не каждому из нас захочется листать бумажную карту за рулём автомобиля для того, чтобы понять, как проехать. Навигатор справляется с этой задачей лучше. И естественно, он использует модели машинного обучения, персонализацию и адаптивность.

Мы этого просто не чувствуем — так же, как при выборе контента в музыкальном плеере или в онлайн-кинотеатре мы не задумываемся, почему нам предлагают конкретный фильм или трек.

В плане рутины ИИ уже можно сравнить с чем-то обыденным вроде электричества.

Коллаборация с селебрити, которую мы показали в третий день конференции, — это только первый подход к снаряду. Но я почти уверен, что через три, пять или семь лет индустрия медиа, кино, музыкального продакшена будет основана на ИИ так же, как сегодня наша дорога от дома до работы основана на использовании навигатора в телефоне. Это не хорошо и не плохо. Это просто меняет наш образ жизни.

В Сбере есть свои правила по работе с искусственным интеллектом?

Да, у нас есть внутренний этический документ. И я думаю, что в начале следующего года мы сделаем его публичным. Примерно такие же программные документы есть у других технологических компаний — Microsoft, Google. Все говорят примерно об одном и том же наборе принципов.

Во-первых, это применение искусственного интеллекта во благо, а не во зло.

Это интерпретируемость: технологии не должны выйти из-под контроля, а для этого нужно хорошо понимать, как они работают.

Это принципы недискриминации: мы не можем ограничивать определённые группы клиентов просто потому, что у них какие-то показатели выглядят иначе, чем у других.

Есть также принцип устойчивости. Если модели, которые используются для принятия решений и кастомизации продуктов, начинают вести себя аномально, должна быть возможность это пресечь.

Общий принцип такой: технологии искусственного интеллекта должны помогать людям принимать решения, оптимизировать время и повышать качество жизни. И не представлять угрозы.

Если говорить в целом о сфере, какие команды и проекты вы считаете наиболее интересными?

Здесь тоже без новостей, лидеры всё те же — технологические компании, которые именуются акронимом FAANG в Америке и BAT в Китае. Это Facebook, Apple, Amazon Web Services, Netflix, Google. К ним я добавил бы Microsoft.

Если говорить про китайские, то в первую очередь Huawei, Tencent, Baidu и Alibaba. С точки зрения искусственного интеллекта в последние несколько лет можно отметить прогресс именно Tencent и Huawei. С последними мы активно проводим некоторые совместные исследования и видим их немножечко изнутри. И эта команда одна из сильнейших в мире по ИИ.

В Европе есть более или менее индустриальные команды в институтах. Самая мощная европейская компания — DeepMind, дочка Google, которая активно занимается биологическими архитектурами нейронных сетей и обучением с подкреплением.

Чтобы вы назвали главным событием или прорывом в отрасли за прошедший год?

Я считаю, что это генеративные модели. Команда OpenAI в мае выпустила генеративный языковой трансформер GPT-3. Он доступен проприетарно за деньги от OpenAI — на английском языке.

Мы тоже занимаемся генеративными моделями. Понятно, что для русскоязычного текстового контента делать их сложнее, потому что его в глобальной сети значительно меньше, чем англоязычного. На одном из треков соревнований участники «прокачивали» модель GPT-3 для русского языка — ruGPT-3. Мы будем распространять её не проприетарно, а бесплатно, — как минимум в исследовательских и образовательных целях.

Если говорить про прикладную область, то в этом году мы увидели очень большое количество сервисов и приложений, работающих на основе технологии deepfake. К счастью, пока она бешено популярна только в индустрии развлечений — будем надеяться, что так это и останется. Современный уровень систем машинного зрения позволяет получать достаточно фото- и видеорелистичные картинки.

Что нового у этом году у ИИ в «Сбере»?

Мы тоже не сидели на месте. На прошлой AI Journey мы презентовали самый мощный суперкомпьютер в стране, а в этом году — набор продуктов для работы с ним. Часть сервисов из этого набора не имеет аналогов.

Также мы показали библиотеку автоматизированного машинного обучения и генеративную модель ruGPT-3. Пока она использует 760 млн параметров, но весной мы покажем следующее поколение с существенно большим их количеством. Будет что-то вроде той самой GPT-3 от OpenAI.

Поговорим про устройство вашего направления в Сбере. Над какими задачами работает команда, насколько она большая?

В Сбере команды дата-сайентистов и инженеров данных федерализованы, то есть нет централизованных структур. В каждом бизнес-направлении, в каждой продуктовой команде есть набор ролей: дата-сайентисты, дата-инженеры, ML-инженеры.

90% специалистов по работе с данными Сбере трудятся именно в agile-командах. Централизация тоже есть, например, в лаборатории искусственного интеллекта, в которой команды работают над более глубоким R&D, хотя и всё ещё прикладным.

Важно не забывать, что дата-сайентист — прежде всего scientist, поэтому у нас есть KPI на R&D. Мы внедряем инновации с фокусом на то, как улучшить процессы с помощью новых методов, а не опираться на устоявшийся инструментарий.

У нас есть внутренний KPI на «опромышливание» — индустриализацию того, что делает R&D-команда в лаборатории искусственного интеллекта.

Понятно, что у дата-сайентистов, которые работают внутри продуктовых команд, доля science значительно меньше, чем у разработчиков в лаборатории, но тем не менее все они занимаются не только разработкой, но и исследованиями. В лабораториях больше, в продуктах меньше.

Наверное, сейчас в Сбере нет задач, в которых не применяется анализ данных. Мы поставили себе цель: до 2022 года 100% процессов и продуктов должны использовать искусственный интеллект. В большинстве случаев это экономически оправдано или позволяет поднять клиентский опыт на недоступный ранее уровень.

В этом году мы открываем Институт искусственного интеллекта, в котором будем проводить фундаментальные исследования. Сейчас мы не можем себе позволить исследования уровня DeepMind или Google: внутри Сбера у каждого продукта должен быть «спонсор». Это может быть гипотетически CEO организации или один из его первых замов. Понятно, что к CEO организации бегать каждый раз невозможно. Поэтому решили открыть институт для расширения объёма фундаментальных R&D.

А что после 2022 года? Какой путь искусственного интеллекта в компании дальше?

Уже практически не существует рабочих мест или людей без доступа к интернету. Через телефон, планшет, десктоп — доступ есть у всех. Дальше появляется 5G. Даже 10 лет назад скорость передачи данных через мобильный интернет была существенно ограничена, а сейчас мы легко общаемся в Zoom. То же самое происходит и с ИИ. Пока мы более или менее научились автоматизировать рутину.

Дальше — не рутина. Чем сложнее задачи, тем более сложные когнитивные способности требуются для их решения. Это касается и работы топ-менеджеров. Для них сейчас мы разрабатываем интеллектуальную систему управления. Она называется Digital Manager и использует NLP, граф знаний и машинную оценку когнитивных искажений — при одних и тех же вводных человек в разных настроениях может принимать разные решения.

Ещё дальше — то, что называется «нейро-AGI». Это узконаправленный сильный искусственный интеллект, который может переобучаться на лету или использовать модели и алгоритмы, обученные в задачах одного класса, для решения задач другого класса. Я думаю, что в этой области в ближайшие пять-семь лет случится прорыв.

Многие считают, что не стоит ждать появления AGI ещё лет 50, но взгляните хотя бы на тот же генеративный трансформер. Тексты, которые он пишет, не идеальны, но в сочетании с качественными, хорошо развитыми системами, мощным суперкомпьютером под капотом и выстроенными бизнес-процессами такие модели могут в ближайшие несколько лет автоматизировать достаточно сложный набор действий, например разбор нашей почты.

И такие эксперименты уже есть. Даже циркулирующую между топ-менеджерами почту уже мог бы разобрать алгоритм — и сгенерировать ответы не хуже них самих.

0
27 комментариев
Написать комментарий...
Боря Бро

Ага, думал шутка «где карту открывали, туда и идите» уже давно в прошлом, но вчера в самом центральном отделении Сбера на Цветном бульваре не смогли открыть аккредитив, мол, у вас счет открыт в другом отделении Москвы!🤷🏻‍♂️ Как выход из ситуации предложили открыть счет в их отделении, а потом уже перевести деньги на него в интернет-банке!🤦🏻‍♂️ А вы всё про искусственный интеллект!😆

Ответить
Развернуть ветку
Крымский Чайничек

какой же это прорыв? 

Ответить
Развернуть ветку
Story App

Наверное, он о том, что для многих было неожиданным насколько хороша оказалась GPT-3

Ответить
Развернуть ветку
Крымский Чайничек

Ну разве только так 

Ответить
Развернуть ветку
Killer

Прочитал как "дегенеративные модели", задумался.

Ответить
Развернуть ветку
Артем Богданов
Ответить
Развернуть ветку
Сергей Леопольдович

Это все хорошие и правильные слова для ушей императоров и тем кто им эти слова потом расшифровывает. 
А для простых ушей простых людей какая от этого польза, пусть даже потенциальная и не прямо сейчас?
Ответы про ботов поддержки вместо поддержки руками Маринки не принимаются )))

Ответить
Развернуть ветку
Denis Bystruev

Простые люди становятся всё более предсказуемыми и управляемыми.

YouTube рекомендует, что смотреть.

Интернет-магазины советуют, что купить.

Новостные каналы выбирают, о чём рассказать, оставляя за бортом 99,999% событий.

Единственный вариант — уйти в лес и жить там без интернета, телевизора и радио.

Но почему-то никто так не делает.

Ответить
Развернуть ветку
Сергей Леопольдович

YouTube рекомендует, что смотреть - отчасти угадывают
Интернет-магазины советуют, что купить - всегда какой-то почти неадекватный список выдают
Единственный вариант — уйти в лес и жить там без интернета, телевизора и радио. - Все же более разумный вариант - почаще пользоваться своим мозгом, а не полагаться на советчиков и прочих владельцев лапшичных для ушей, imho.

Ответить
Развернуть ветку
Vladimir Batenev

вангую: свой мозг с развитием технологий (в том числе и тех, что внушают нам мысль о том, как классно мы живем) все чаще будут считать роскошью

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Eugene Danilov

Что за бред про оставленные за бортом 99,9% новостей. 2-3 новостных портала, 2-3 минуты в день — и ты в курсе 99,9% значимых событий в мире

Ответить
Развернуть ветку
Vladimir Batenev

почему минус? Просьба написать расширенный ответ, включающий различие между линейным ИИ и матричным. И дальше перейдем в дискуссию. Поверьте будет интересно.

Ответить
Развернуть ветку
Vladimir Batenev

Изучали матричную математику для ИИ, или только теория?

Ответить
Развернуть ветку
Vladimir Batenev

 Любая прога для нас уже ИИ... ясно.
к чему вопросы https://vc.ru/flood/193048-davayte-delat-pauzy-v-slovah

Ответить
Развернуть ветку
Трейдер мамкин

Мне одному кажется что все кто занимается ии сами не особо поминают что они делать и зачем... Ну не может заменить бот даже самого тупого человека из техподдержки... Пока идея посадить 10 менеджеров более здоровая чем вложить миллионы в ии и получить бота который только и может что находить ключ в запросе и отвечать стандартным ответом

Ответить
Развернуть ветку
Крымский Чайничек

Он заменить может, но смысл от этой замены? Сама сфера ИИ очень переоцененна

Ответить
Развернуть ветку
Трейдер мамкин

Не может, и доказательства этому сотни тысяч телефонных мозгоебов

Я бы очень был доволен если бы мне в банке в чате отвечал бот и решал мои сложные вопросы - никаких очередей, моментальный ответ, банк имеет меньше расходов и уязвимостей... Но как сказал выше все до чего доросли эти боты это выявлять паттерны и кое как хранить контекст

Ответить
Развернуть ветку
Крымский Чайничек

Я как человек работающий с ботами (я их создаю) что они все это решают) ОНИ ДРУГОЕ не решают)))

Ответить
Развернуть ветку
Трейдер мамкин

Этот текст тоже бот писал?)))

Ответить
Развернуть ветку
Крымский Чайничек

ты боты не писал и не понимаешь что в мешок слов можно засунуть новые слова, но это никак не поможет коммуницировать с новым пользователем которому допустим лет 15и у него смысловые отенки совсем другие. 
Я тебе скажу что это такая боль 

Ответить
Развернуть ветку
Трейдер мамкин

Все верно, потому что бот что бы понимать человека должен иметь ассоциативно связанную модель языка и абстрактное мышление, то есть фразу
"Засунь слона в утюг"
Он должен понимать как что то бредовое

Ответить
Развернуть ветку
Крымский Чайничек

научная классика это "зеленые мысли яростно спят"

Ответить
Развернуть ветку
Сергей Леопольдович

Три зеленых свистка  ))) 

Ответить
Развернуть ветку
Борис Яровой

Самого тупого человека из тех поддержки может заменить даже чайник. Поэтому таких людей чайниками и зовут

Ответить
Развернуть ветку
stivstivsti

Цитата пусика про инновации это же днище.

Ответить
Развернуть ветку
Женя Гагарин

одним словом - "промо"

Ответить
Развернуть ветку
Иван Сергеев

Blackstar отдает определенным запахом. И не знаю какой запах хуже - оно или БМ.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
24 комментария
Раскрывать всегда