Где чаще всего применяют ИИ?

ferra.ru
ferra.ru

За последние полвека искусственный интеллект прошел путь от мечты фантастов до утилитарных разработок, которые мы используем каждый день. И хотя первые работы в области нейронных сетей датируются 40–60 годами двадцатого века, бум технологий пришёлся на последние четыре года. О том, как и зачем компании сегодня развивают ИИ, рассказал основатель группы EORA Роман Доронин в ходе выступления на «Телеком Интенсиве».

Искусственный интеллект, как и другие высокие технологии, с точки зрения обывателя, окружён ореолом загадочности. Отчасти это заслуга мировой фантастики: в первую очередь, под ИИ люди обычно подразумевают компьютерный разум, полностью аналогичный разуму человека – но созданный искусственно, учёными и программистами. Но это не совсем верные представления, отмечает Роман Доронин.

"Люди ждут, что ИИ будет системой, которая может всё и вся. Но важно понимать, что искусственный интеллект – это лишь автоматизация сложных, но очень конкретных процессов. Нейросети могут работать по чётко очерченным правилам, и в большинстве случаев для этого нужны огромные объемы данных", – подчеркнул Роман Доронин.

Именно поэтому активно нейросети начали развиваться лишь с повсеместным распространением высокоскоростного интернета. При этом всегда существует проблема мощностей, поэтому любая нейросеть приспособлена для работы в одном специфическом направлении. Кроме того, нейросеть не обладает собственной волей и не способна выйти за рамки поставленной задачи.

Тренд №1: голосовые ассистенты

Одной из наиболее перспективных технологий на сегодняшний день являются голосовые ассистенты. По сути, это новый, более совершенный вид интерфейса – следующая ступень развития после обычного web-сайта.

Основатель EORA подчеркнул, что сегодня большинство компаний стремится обзавестись такими корпоративными программами на основе ИИ. По его прогнозам, по истечении ближайших пяти лет персональный голосовой помощник будет у каждого человека. Он станет такой же частью нашего быта, как смартфоны сейчас.

"Вы будете, не задумываясь, спрашивать нечто вроде: “Алиса, где можно купить наушники для моего телефона?” Помощник переведёт ваш голос в текст, обработает запрос и направит в базу данных магазина электроники. Там найдёт интересующий товар и выяснит ближайшую локацию, после чего скажет вам, что в соседнем магазине есть искомые наушники, или предложит оформить заявку на доставку. Деньги за товар спишутся автоматически при пользовательском разрешении", – добавил Роман Доронин.

Тренд №2: машинное зрение

Вторая технология, всё плотнее входящая в нашу повседневность – так называемое Computer Vision. Оно получает всё более широкое распространение, и можно без преувеличения сказать, что сегодня оно используется практически везде.

"Если вам пришло “письмо счастья” от ГИБДД – это машинное зрение. Разблокировать смартфон при помощи технологии распознавания лица? Оно же. Если врач хочет подробнее изучить ваш рентген-снимок, он также может прибегнуть к помощи машинного зрения. Это огромная индустрия!",– отметил Роман Доронин.

Абсолютно все технологии распознавания лиц, применяемые на производстве или в системах безопасности – продукт машинного обучения, подчеркнул основатель группы компаний EORA. Искусственный интеллект после соответствующего обучения может выполняться самый широкий спектр задач: от поиска определённых лиц в толпе прохожих до контроля рабочего времени сотрудников на производстве.

"Все эти технологии базируются на машинном обучении – это абсолютно новый подход в программировании! В основе его лежит не просто практика обучения на примерах, а способность машины находить закономерности. То есть, для распознавания лиц мы возьмём пять миллионов лиц, покажем их некой системе и научим её искать в этих изображениях закономерность", – пояснил он.

У машинного обучения довольно широкий функционал. Например, машинное зрение можно применять для диагностики рака лёгких. Нейросети покажут массив нормальных снимков МРТ и массив снимков с аномалиями. После чего систему научат распознавать признаки таких аномалий. В итоге можно будет показать нейросети любой снимок МРТ и спросить, есть ли там отклонения, на которые врачу стоит обратить внимание.

У машинного обучения огромное количество направлений, одно из них обучение с подкреплением. Схожим образом происходит обучение навигационных программ для автономных беспилотных летательных аппаратов (БПЛА). Создаётся виртуальная модель определённой местности с различными препятствиями: деревьями, домами, опорами ЛЭП. В неё запускается виртуальный же беспилотник. Поначалу нейросеть сталкивается с препятствиями, за что получает штрафы. Таким образом она накапливает массив данных, необходимый для ориентации в реальном пространстве и безаварийного пилотирования дрона.

Тренд №3: DeepFake - генерация изображений

Одним из трендов в машинном обучении являются технологии DeepFake, которые зачастую базируются на алгоритмах генеративно-состязательных нейронных сетей (GAN). На основе заданного массива данных нейросеть может дорисовать определённую картинку либо вообще превратить схематичный эскиз в фотореалистичное изображение. Наиболее яркий пример этого тренда: приложения, способные “состарить” человека на определённое количество лет или же “изменить” его пол.

В такого рода алгоритмах задействованы, как правило, нейросети двух типов: генератор и дискриминатор. Задача первой: сгенерировать некое изображение, согласно заданию, похожее на реальное. Она делает это на основании полученных ранее данных. Вторая же оценивает сгенерированные данные и сравнивает их с реальными, после чего принимает решение – принять или забраковать.

В результате мы можем получить довольно качественное и правдоподобное изображение – однако не созданное с нуля, а собранное по кусочкам из различных фотографий. Нейросети направления DeepFake способны также комбинировать картинки, перенося стиль одного на черты другого. Таким образом, например, можно получить портрет человека, составленный из цветов и листьев кустарника.

При этом искусственный интеллект способен работать не только с изображениями. В целом машинное обучение применимо для всех типов данных. В том числе с его помощью можно синтезировать голос конкретного человека, создавать видео или тексты. Причём в случае с текстами нейросеть способна копировать стиль конкретного автора при составлении прозы или стихов.

«Телеком Интенсив» - телеком-конференция для российских СМИ, которая ежегодно проходит в Сочи. В качестве спикеров и специальных гостей принимают участие авторитетные эксперты в области IT, телекома и медиа. Организатором площадки является оператор Триколор.

22
Начать дискуссию