Вкалывают роботы, счастлив...владелец сайта! Как ИИ ворвался в digital
Эту картинку сделал ресурс Сбера ruDALL-E в ответ на запрос "Котёнок рад: он зарегистрировал домен и заказал хостинг". Сказать, что это потрясающе – ничего не сказать.
В этой статье хотим рассказать о том, как повлияли технологии искусственного интеллекта на работу digital-специалистов.
Всё же, о чем речь?
Искусственный интеллект — относительно новый инструмент. Он способен к обучению и может “мыслить”, как человек: например, отвечать на вопросы или обыграть человека в шахматы.
Первые варианты развития ИИ появились в нулевых. В 2007 году Арно Мегре и Джефф Дел создали онлайн-игру Акинатор. Суть игры: вы загадываете персонажа (реально существующего человека или вымышленную персону). Задача джинна — отгадать вашего персонажа. Для этого он задаёт наводящие вопросы, на которые дано пять вариантов ответа.
Например, мы загадали Уилла Смита. Джинн справился.
Несмотря на то, что ИИ пока не может написать симфонию или создать шедевр, он активно развивается и используется в разных сферах. Он нужен, чтобы пользователю было проще взаимодействовать с приложением или сайтом.
Ниже мы рассказали о сферах, в которых применяется искусственный интеллект.
Диалог с человеком
Если вы обращались в чат службы поддержки (например, банка), то сталкивались с чат-ботом. Когда вы задаёте вопрос, бот анализирует сообщение и на его основе отправляет готовый ответ.
По тому же алгоритму работают боты в колл-центрах и голосовые помощники, например, Алиса от компании Яндекс. Когда вы обращаетесь к Алисе, она отделяет ваш голос от внешних звуков при помощи технологии SpeechKit. Кроме того, Алиса понимает англицизмы, сленг, региональные диалекты и акценты. Это достижимо благодаря анализу базы Яндекса: в ней хранится более миллиарда слов и фраз, произнесённых в разных условиях.
На этапе подбора ответа Алиса использует технологию Turing, которая основана на тесте Тьюринга. Благодаря этому функционалу Алиса может не только отвечать на вопросы, но и поговорить с вами на отвлечённые темы.
Финальный этап — озвучивание ответа. Алиса делает это с помощью технологии Text-to-speech. В основе ответа лежат слова и фразы, записанные в студии и впоследствии порезанные на фонемы. При воспроизведении ответа нейросеть сглаживает интонационные неровности, поэтому “речь” Алисы звучит естественно.
Интересный факт: на начальном этапе Алису обучали произведениям русской классики. Затем в обучение включили обычные тексты из интернета. От такого сочетания на первых тестах Алиса давала слегка дерзкие ответы и этим веселила пользователей. Безусловно, все ответы были в рамках приличия. Однако чтобы избежать грубости от голосовой помощницы, разработчики внедрили фильтры и стоп-слова.
Таргетинг
Наверняка у вас бывало подобное: вы искали, например, товары для спорта и вводили запросы в поисковик. После этого на других сайтах появлялась реклама спортивных магазинов и брендов. Вездесущая реклама — это работа таргетинга.
В основе таргетинговой рекламы лежит искусственный интеллект. Он анализирует все ваши поисковые запросы и предлагает ресурсы, близкие по тематике.
По тому же алгоритму работает таргетинг в социальных сетях, например VK. Если аккаунт новый и вы вошли в него впервые, лента предлагает самые популярные новости. Дальнейшая выдача зависит от вашей активности: вы ищете и подписываетесь на паблики, оставляете комментарии, публикуете посты, добавляете в друзья других пользователей. ИИ анализирует эти действия и корректирует вашу ленту. Поэтому таргетинг предлагает то, что входит в примерный круг ваших интересов.
Текст
Искусственный интеллект может работать с текстом. Самое популярное применение ИИ — это онлайн-переводчики. Это позволяет переводить на иностранный язык не только отдельные слова, но и фразеологизмы.
Например, в английском языке есть выражение “It's raining cats and dogs”. Оно обозначает сильный дождь, русский аналог “Дождь льёт как из ведра”.
Google Translate понимает это выражение и не переводит его буквально.
Мультимедиа
Возможно, вы уже встречались с сервисами, которые позволяют протестировать работу нейросети. Например, This Meme Does Not Exist сгенерирует для вас забавный мем.
Осенью 2021 года компания Сбер представила новый сервис — ruDALL-E. Нейросеть генерирует картинку из текста: для этого достаточно ввести слово или фразу. Например, такая картинка у нас получилась из фразы “Красивый солнечный пейзаж”.
Подобные технологии используются и для создания видео. Самый известный пример в России — это реклама Сбера, в которой Жорж Милославский оказался в 2020 году.
Для работы с визуальным контентом используется технология GAN. Она умеет анализировать текст и создавать картинки на его основе. В обратную сторону это тоже работает: GAN может переводить картинки в текст. Самая главная особенность этой технологии — умение работать с датасетами (наборами данных в хранилище) изображений. Это позволяет наложить картинку на другое изображение или видео, причём делает это правдоподобно.
Например, благодаря GAN вы можете заменить каст в любимом фильме или добавить себя на фото со знаменитостью и разыграть друзей.
Восстание машин: стоит ли бояться?
Восстание машин нам не грозит. И на это есть несколько причин:
- Правила “мышления” искусственного интеллекта задаёт человек. Несмотря на то, что ИИ может обучаться и гибко перестраиваться при выдаче результата, в его основе лежат чёткие логические алгоритмы. Это значит, что неотступные правила работы всё-таки есть.
- Искусственному интеллекту ещё предстоит многому научиться. ИИ справляется с относительно небольшими задачами. Но там, где нужно подключить воображение, может случиться забавная неожиданность. Прямо как в самом начале этой статьи.
Чуть не забыли. Делитесь творениями ИИ и вашим опытом работы с технологией в комментариях. Обещаем всё-всё почитать и посмотреть.
Шиба нашёл биткоины и радуется