Сбербанк
313

Как научить AI думать

Искусственный интеллект (ИИ) обыграл человека в шахматы и го и регулярно наносит нам поражение в компьютерных играх. Он уже распознает тексты и лица лучше нас. А «Сбербанк» вместе с другими игроками на рынке хочет научить его понимать и писать по-русски и даже сочинять стихи не хуже Пушкина.

В закладки

Татьяна Шаврина, руководитель направления NLP в Sberbank Data Science Communtiy, рассказывает, зачем это нужно бизнесу и как соревнования по искусственному интеллекту приближают нас к будущему.

​Здесь и далее — фото пресс-службы ПАО «Сбербанк»

По прогнозам консалтинговой компании Frost & Sullivan, объём рынка технологий искусственного интеллекта к 2022 году достигнет $52,5 млрд. ИИ становится массовым решением для корпораций, и кажется, что компании должны разрабатывать новые продукты втайне от конкурентов. Но на нынешней стадии развития ИИ это не имеет смысла. Почему?

Любая система на базе ИИ может дать фору человеку, но решает только конкретную задачу: например, распознает лица или вычисляет оптимальный объём поставок. Для создания роботов из фантастических фильмов, которые делают все и сразу, нужен общий искусственный интеллект (Artificial General Intelligence, или AGI), который обладает разумом и сознанием. Но попытки его реализации пока не увенчались успехом.

Поэтому пока нет смысла скрывать свои решения — разработчикам и дата-сайентистам важно обменяться опытом, понять, возможно ли приблизиться к его созданию и нащупать потенциальные пути решения задачи.

Думать как человек

Для развития индустрии ИИ «Сбербанк» вместе с партнёрами организовал форум по искусственному интеллекту Artificial Intelligence Journey (AI Journey). В рамках форума прошли соревнования по созданию общего искусственного интеллекта. Его результаты объявят на конференции AI Journey 2019 8–9 ноября, а лучшие решения выложат в репозиторий, чтобы независимые разработчики и коммерческие компании могли ими воспользоваться.

Соревнование AI Journey — это фактически экзамен для искусственного интеллекта по русскому языку и литературе. С 4 сентября корпоративные команды от крупных компаний и ИИ-стартапов тренировали свои системы в прохождении теста.

Программы должны были добавлять пропущенные буквы, знаки пунктуации, писать тексты на заданные темы и анализировать смысл предложений.

Соревнование преследовало амбициозную цель: создание систем с элементами общего искусственного интеллекта, при этом работающих с русским языком.

Есть несколько тестов в мире, которые определяют, насколько хорошо искусственный интеллект справляется с бытовыми и интеллектуальными задачами. Наиболее известен один из вариантов теста Тьюринга: если машина в переписке убедит 30% судей, что она человек, значит можно говорить о её «мышлении». Алан Тьюринг в 1950 году считал прохождение такого теста доступным только разуму, но глубокое обучение и вычислительные мощности полвека спустя — в 2014 году — позволили пройти испытание компьютерной программе.

Общая идея таких тестов понятна: сильный интеллект должен уметь общаться на человеческом языке — это одна из задач в направлении обработки естественного языка, которая является частью технологии NLP. NLP-системы уже способны не только отвечать на конкретные вопросы, но и писать эссе, в котором встречаются вполне литературные фразы.

ИИ достиг больших успехов в задачах на понимание языков, особенно английского. В 2011 году люди-рекордсмены в Jeopardy! (аналог в России — «Своя игра») уступили IBM Watson, которой потребовалось отвечать на фактологические вопросы (то есть требовалось «понять» вопрос и дать ответ на английском языке, используя свою базу знаний).

Для более точной оценки прогресса ИИ в 2018 году была разработана система тестов GLUE (General Language Understanding Evaluation). Среди прочего в рамках теста машине нужно сгенерировать ответы на университетские вопросы; оценки выставляются в баллах. Пока лучшие системы на базе алгоритма Google BERT и его производных получают результат 80%, что хуже среднестатистических для человека — 90%.

Искусственный интеллект проходит тест GLUE на английском языке. Организаторы AI Journey решили, что в их соревновании NLP-система должна работать с русским. ИИ предстояло пройти 26 тестов по русскому языку и написать сочинение.

Кто-то из участников соревнования смог собрать больше открытых данных для своей системы — например, скачать и использовать больше школьных учебников. Кто-то больше сил вложил в дообучение собственной универсальной модели, а кто-то сфокусировался на моделировании поведения школьника. Задача новая, и очевидного пути решения не было. В соревновании приняли участие 93 команды, лучший результат среди команд – 54 балла из возможных 100.

Бизнес на русском

Оборот рынка NLP в 2017 году составлял почти $10 млрд и вырастет до $29 млрд в 2026 году. Обработка естественного языка широко применяется в бизнесе — для чат-ботов, автоматизации документооборота, системах помощи в принятии решений и так далее.

Например, IBM предлагает модуль для использования Watson в системах распознавания медицинских снимков и записей, они помогают врачу ставить диагнозы пациентам. Сервис помощи при письме Grammarly в октябре 2019 года оценили в $1 млрд.

Одно из самых частых применений NLP — в чат-ботах. Крупнейшие технологические компании — Google, IBM, Microsoft — и молодые стартапы выпускают инструменты, позволяющие сконструировать ботов. Одни бесплатно дают свой код, другие просят денег за модули машинного обучения, конструкторов скиллов, аналитики. Так формируется рынок чат-ботов, которые кардинально различаются своими возможностями. Одни общаются шаблонными фразами по жестким сценариям, а другие способны разговаривать на человеческом языке и синтезировать речь, близкую к естественной.

Хорошие чат-боты снижают нагрузку на колл-центры, экономят деньги компании. Понятно, что мессенджер с диалоговым агентом, который безошибочно понимает, когда надо назначить встречу или совершить платёж, будет набирать популярность. То же самое произойдет и с другими продуктами на базе NLP: выиграет тот, кто будет точнее анализировать документы, формировать отчёты, давать советы людям или принимать за них решение.

За время проведения соревнования AI Journey удалось создать решения, которые достаточно хорошо понимают русский язык и в будущем могут быть использованы для чат-ботов и других бизнес-сервисов.

Есть ли повод для оптимизма?

Системы NLP показывают быстрый прогресс. Современные вычислительные возможности дают анализировать все большее количество текстов, что при глубоком обучении улучшает результат. В тесте GLUE за год существования оценка ИИ улучшилась с 68% до 80%. Однако мы не знаем, удастся ли в случае с NLP компьютерным системам обойти человека. С одной стороны, в истории уже были периоды, когда развитие искусственного интеллекта замирало на десятилетия. С другой, у нас есть примеры явного прогресса: тексты и фотографии компьютер распознает уже лучше человека.

Текущий уровень ИИ можете оценить по нижеприведенному эссе о Пушкине — программа даже стихи придумала за поэта. Всего за тестовую часть машина набрала 37 баллов из 59 возможных. При аналогичной оценке за школьный экзамен ИИ уже получил бы аттестат зрелости, но еще не смог бы поступить в вуз.

Стихотворение «Деревня» повествует о молодой, великой России. Она включает в образ родной земли «родной край», в то же время есть «и поля, и поля, и поля, и твои белыми, и святой закона». в этом цикле, где рассказывается о событиях в Царском Селе, Пушкин показывает день близок к свободе, но не может простить этому:

Там бывало, где гора,

Когда мгновенно оно,

Как солнце, лед и звон прямое

Независимость от гор.

Все за душе, все равно

Везде вижу, этих людей

Здесь, в краю отцов, отец, брат,

Очень критически относится к их сердцу. в этих словах, по мнению Пушкина, есть свобода, и в том, как является великая и великая русская земля, не следует забывать: Пушкин — звезда, которая помогла Анне Ахматовой навсегда сохранить веру в идеалы своего народа.

8–9 ноября в Москве пройдёт конференция AI Journey 2019. На ней выступят эксперты из «Сбербанка», «Яндекса», МТС и других компаний. Они расскажут, как применять ИИ в науке, бизнесе и жизни.

{ "author_name": "Сбербанк", "author_type": "editor", "tags": [], "comments": 0, "likes": 4, "favorites": 1, "is_advertisement": false, "subsite_label": "sberbank", "id": 90823, "is_wide": true, "is_ugc": false, "date": "Tue, 05 Nov 2019 14:12:30 +0300", "is_special": false }
0
{ "id": 90823, "author_id": 137210, "diff_limit": 1000, "urls": {"diff":"\/comments\/90823\/get","add":"\/comments\/90823\/add","edit":"\/comments\/edit","remove":"\/admin\/comments\/remove","pin":"\/admin\/comments\/pin","get4edit":"\/comments\/get4edit","complain":"\/comments\/complain","load_more":"\/comments\/loading\/90823"}, "attach_limit": 2, "max_comment_text_length": 5000, "subsite_id": 137210, "last_count_and_date": null }
Комментариев нет
Популярные
По порядку
{ "page_type": "article" }

Прямой эфир

[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox_method": "createAdaptive", "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fizc" } } }, { "id": 4, "label": "Article Branding", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "cfovx", "p2": "glug" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfk" } } }, { "id": 6, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "bscsh", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "createAdaptive", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223676-0", "render_to": "inpage_VI-223676-0-1104503429", "adfox_url": "//ads.adfox.ru/228129/getCode?pp=h&ps=bugf&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid10=&puid21=&puid22=&puid31=&puid32=&puid33=&fmt=1&dl={REFERER}&pr=" } }, { "id": 15, "label": "Баннер в ленте на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudx", "p2": "ftjf" } } }, { "id": 16, "label": "Кнопка в шапке мобайл", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byzqf", "p2": "ftwx" } } }, { "id": 17, "label": "Stratum Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvb" } } }, { "id": 18, "label": "Stratum Mobile", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvc" } } }, { "id": 19, "disable": true, "label": "Тизер на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "p1": "cbltd", "p2": "gazs" } } }, { "id": 20, "label": "Кнопка в сайдбаре", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "cgxmr", "p2": "gnwc" } } } ] { "page_type": "default" }