Каких — узнали на конференции «Сбера», посвящённой ИИ.Материал подготовлен при поддержке «Сбера»23–24 ноября прошла конференция «Путешествие в мир искусственного интеллекта» — AI Journey 2022, где «Сбер» обсуждал новейшие исследования в сфере ИИ и машинного обучения вместе с теоретиками и практиками индустрии. Посмотреть все выступления можно на сайте конференции, а в этом материале мы собрали самые интересные тезисы.Как создаются игры с помощью ИИПавел Гращенков, руководитель команды текстовых нейронавыков, SberDevices.Марина Ермолаева, ведущий разработчик, SberDevices.Тема выступления: «Нейрофэнтези: сочиняем с ruGPT-3»Марина и Павел генерируют русскоязычные квесты — игровые истории, которые нейросеть в реальном времени пишет совместно с пользователем — с помощью ruGPT-3-модели (третье поколение алгоритма обработки естественного языка от OpenAI). Их проект «Нейрофэнтези» уже доступен пользователям ассистентов «Салют» и, по словам создателей, не уступает англоязычному нейроквесту AI Dungeon.Но для ИИ важно правильное обучение, чтобы сюжет был складным. Удачная модель будет состоять из двух частей. Первая, обученная, например, на описаниях фильмов или сказок, будет генерировать изначальный сеттинг — средневековый замок, инопланетный корабль или дом с привидениями. Вторая отвечает и за предлагаемые действия, и за развитие сюжета на их основе.Для обучения первой модели, создающей начало историй, использовали тексты разных жанров, из которых с помощью синтаксического парсера извлекли словосочетания нужных типов. После этого был задан шаблон, который модель заполняла. Например, такой: «Вы — [одушевлённое существительное], которое [относительное предложение]. Теперь вам предстоит [глагол в неопределённой форме]. В этом вам поможет [неодушевлённое существительное]». В фэнтези-модели появятся разнообразные драконы, замки и рыцари. В жанре фантастики — инопланетяне и космические корабли.От второй модели команде было нужно развитие сюжета. На это влияют логичные и при этом отличные друг от друга действия, между которыми игрок делает выбор, и последовательные части истории, которые система предлагает следом за ходом игрока. Чтобы модель предлагала разные действия, команда добавила кластеризацию и брала лучшие предложения из каждого кластера. А чтобы модель выдавала связные и логичные пассажи, её научили согласовывать текст предыдущего саджеста (блока с выбором) и начало следующего пассажа (части истории).Модель обучали на квестах из русскоязычных открытых источников и текстах, написанных профессиональными редакторами специально для проекта. Также команда создала инструмент, который преобразовывает обычные художественные тексты без разметки в обучающие данные.Если алгоритмы научатся понимать сарказм, они помогут многим людямПушпак Бхаттачария, профессор кафедры компьютерных наук и инженерии, Индийский институт технологий в Бомбее.Тема выступления: «NLP и общество: взгляд на анализ чувств, эмоций и мониторинг психического здоровья»Пушпак Бхаттачария учит роботов распознавать сарказм — одну из самых неочевидных форм коммуникации. Алгоритмам тяжело распознавать его, потому что значение одних и тех же слов в саркастичных предложениях может меняться в разных контекстах. В исследованиях профессор и его команда опирались на классификацию сарказма, предложенную когнитивными психологами. Они утверждают, что в некоторых случаях сарказм основан на сочетании противоположных по интонации слов. Например: «Обожаю, когда меня игнорируют». Также на сарказм может указывать определённое начало фразы. К примеру: «Как будто тебе не всё равно!». Ещё один тип сарказма — иллокутивный — когда какой-то невербальный знак противоречит тексту. Например, если текст сообщения и прикреплённая картинка противоречат друг другу или человек благодарит кого-то за помощь с явным выражением раздражения на лице.В тексте алгоритмы профессора учатся захватывать знаки, которые могут указывать на наличие сарказма: чрезмерное использование пунктуации, междометий, заглавных букв, эмоджи, намеренное нарушение орфографии. Кроме этого, команда пытается обучить алгоритмы фиксировать несоответствие между разными словами в предложении. Возьмём выражение: «Мужчине нужна женщина, как рыбе велосипед». «Как» указывает на то, что вторая часть предложения должна быть схожа с первой. Но слова «мужчина» и «женщина» похожи, а «рыба» и «велосипед» — нет. Задача профессора и его команды — выразить эти сходства или различия математически, а затем натренировать алгоритмы их распознавать.Команда разработала виртуального помощника, который должен подбадривать людей в тяжёлых ситуациях: успокаивать, давать надежду, мотивировать. Алгоритмы обучали распознавать признаки психических расстройств — тревожного, депрессивного, обсессивно-компульсивного. Использовали базу данных, состоящую из переписок между людьми, нуждающимися в психологической поддержке, и виртуальными агентами. Кроме этого, команда учила алгоритмы распознавать склонность человека к суициду и определять его психотип на основе классификации Майерса — Бриггса: в ней 16 разных характеров.Важно научиться анализировать движение человека — но не только с помощью видеоРадослав Нейчев, data-scientist, преподаватель МФТИТема выступления: «Распознавание активности и поведения человека»Технологии умеют узнавать лица и отпечатки пальцев, но им пока сложно распознавать движения и поведение. В медицине такая технология поможет распознать спазмы или нарушения работы двигательного аппарата. А на производстве ИИ проконтролирует, соблюдают ли сотрудники технику безопасности.Важно научиться анализировать движение на основе не только видеозаписей, но и любых доступных данных. Например, можно восстановить траекторию движения руки человека, который носит смарт-часы, потому что в них встроен акселерометр (прибор, который измеряет ускорение — он нужен для определения положения устройства в пространстве). Однако пока наборов данных из разных источников не хватает, поэтому Радослав с исследовательской командой решили собрать их самостоятельно. Цель — отследить положение разных частей тела в пространстве в определённые промежутки времени. Сначала они привязывали изолентой к руке телефон и прыгали с ним перед камерой (позже всё-таки использовали спортивные бинты). Потом перешли на небольшие IMU-датчики (инерциальные измерительные блоки, проще говоря — датчики положения).Когда вопрос с распознаванием движения будет решён, исследователям предстоит выяснить, как можно объединить такие данные с информацией, например, о здоровье человека.Смотреть выступления Реклама, ПАО Сбербанк. 18+
Довольно оригинально. Меня впечатляет тот объём работы и привлеченных специалистов, что необходим для решения подобной задачи. И вместе с тем, стало интересно, а в каких ещё сферах могут пригодиться данные наработки и изыскания?
Квесты интерактиве фиккшн?
с таким оттоком специалистов как сейчас думаю пригодится повсеместно
да ,действительно искусственный интеллект сейчас может пригодится абсолютно везде!
не искусственным тоже пользоваться иногда полезно
Комментарий недоступен
уже мне кажется можно забыть про дизлайки