Вкалывают роботы, счастлив...владелец сайта! Как ИИ ворвался в digital

Эту картинку сделал ресурс Сбера ruDALL-E в ответ на запрос "Котёнок рад: он зарегистрировал домен и заказал хостинг". Сказать, что это потрясающе – ничего не сказать.

В этой статье хотим рассказать о том, как повлияли технологии искусственного интеллекта на работу digital-специалистов.

Искусственный интеллект — относительно новый инструмент. Он способен к обучению и может “мыслить”, как человек: например, отвечать на вопросы или обыграть человека в шахматы.

Первые варианты развития ИИ появились в нулевых. В 2007 году Арно Мегре и Джефф Дел создали онлайн-игру Акинатор. Суть игры: вы загадываете персонажа (реально существующего человека или вымышленную персону). Задача джинна — отгадать вашего персонажа. Для этого он задаёт наводящие вопросы, на которые дано пять вариантов ответа.

Например, мы загадали Уилла Смита. Джинн справился.

А кого загадали вы? Поделитесь в комментариях

Несмотря на то, что ИИ пока не может написать симфонию или создать шедевр, он активно развивается и используется в разных сферах. Он нужен, чтобы пользователю было проще взаимодействовать с приложением или сайтом.

Ниже мы рассказали о сферах, в которых применяется искусственный интеллект.

Если вы обращались в чат службы поддержки (например, банка), то сталкивались с чат-ботом. Когда вы задаёте вопрос, бот анализирует сообщение и на его основе отправляет готовый ответ.

По тому же алгоритму работают боты в колл-центрах и голосовые помощники, например, Алиса от компании Яндекс. Когда вы обращаетесь к Алисе, она отделяет ваш голос от внешних звуков при помощи технологии SpeechKit. Кроме того, Алиса понимает англицизмы, сленг, региональные диалекты и акценты. Это достижимо благодаря анализу базы Яндекса: в ней хранится более миллиарда слов и фраз, произнесённых в разных условиях.

На этапе подбора ответа Алиса использует технологию Turing, которая основана на тесте Тьюринга. Благодаря этому функционалу Алиса может не только отвечать на вопросы, но и поговорить с вами на отвлечённые темы.

Финальный этап — озвучивание ответа. Алиса делает это с помощью технологии Text-to-speech. В основе ответа лежат слова и фразы, записанные в студии и впоследствии порезанные на фонемы. При воспроизведении ответа нейросеть сглаживает интонационные неровности, поэтому “речь” Алисы звучит естественно.

Интересный факт: на начальном этапе Алису обучали произведениям русской классики. Затем в обучение включили обычные тексты из интернета. От такого сочетания на первых тестах Алиса давала слегка дерзкие ответы и этим веселила пользователей. Безусловно, все ответы были в рамках приличия. Однако чтобы избежать грубости от голосовой помощницы, разработчики внедрили фильтры и стоп-слова.

Наверняка у вас бывало подобное: вы искали, например, товары для спорта и вводили запросы в поисковик. После этого на других сайтах появлялась реклама спортивных магазинов и брендов. Вездесущая реклама — это работа таргетинга.

В основе таргетинговой рекламы лежит искусственный интеллект. Он анализирует все ваши поисковые запросы и предлагает ресурсы, близкие по тематике.

По тому же алгоритму работает таргетинг в социальных сетях, например VK. Если аккаунт новый и вы вошли в него впервые, лента предлагает самые популярные новости. Дальнейшая выдача зависит от вашей активности: вы ищете и подписываетесь на паблики, оставляете комментарии, публикуете посты, добавляете в друзья других пользователей. ИИ анализирует эти действия и корректирует вашу ленту. Поэтому таргетинг предлагает то, что входит в примерный круг ваших интересов.

Искусственный интеллект может работать с текстом. Самое популярное применение ИИ — это онлайн-переводчики. Это позволяет переводить на иностранный язык не только отдельные слова, но и фразеологизмы.

Например, в английском языке есть выражение “It's raining cats and dogs”. Оно обозначает сильный дождь, русский аналог “Дождь льёт как из ведра”.

Google Translate понимает это выражение и не переводит его буквально.

Возможно, вы уже встречались с сервисами, которые позволяют протестировать работу нейросети. Например, This Meme Does Not Exist сгенерирует для вас забавный мем.

Осенью 2021 года компания Сбер представила новый сервис — ruDALL-E. Нейросеть генерирует картинку из текста: для этого достаточно ввести слово или фразу. Например, такая картинка у нас получилась из фразы “Красивый солнечный пейзаж”.

Подобные технологии используются и для создания видео. Самый известный пример в России — это реклама Сбера, в которой Жорж Милославский оказался в 2020 году.

Для работы с визуальным контентом используется технология GAN. Она умеет анализировать текст и создавать картинки на его основе. В обратную сторону это тоже работает: GAN может переводить картинки в текст. Самая главная особенность этой технологии — умение работать с датасетами (наборами данных в хранилище) изображений. Это позволяет наложить картинку на другое изображение или видео, причём делает это правдоподобно.

Например, благодаря GAN вы можете заменить каст в любимом фильме или добавить себя на фото со знаменитостью и разыграть друзей.

Восстание машин нам не грозит. И на это есть несколько причин:

Правила “мышления” искусственного интеллекта задаёт человек. Несмотря на то, что ИИ может обучаться и гибко перестраиваться при выдаче результата, в его основе лежат чёткие логические алгоритмы. Это значит, что неотступные правила работы всё-таки есть.
Искусственному интеллекту ещё предстоит многому научиться. ИИ справляется с относительно небольшими задачами. Но там, где нужно подключить воображение, может случиться забавная неожиданность. Прямо как в самом начале этой статьи.

Чуть не забыли. Делитесь творениями ИИ и вашим опытом работы с технологией в комментариях. Обещаем всё-всё почитать и посмотреть.

Вкалывают роботы, счастлив...владелец сайта! Как ИИ ворвался в digital

Всё же, о чем речь?

Диалог с человеком

Таргетинг

Текст

Мультимедиа

Восстание машин: стоит ли бояться?