Как устроен искусственный интеллект: всё, что вы хотели знать об AI, но боялись спросить

Как устроен искусственный интеллект: всё, что вы хотели знать об AI, но боялись спросить

Взяли интервью у Вахрушева Антона, разработчика AI, — и спросили об устройстве и работе искусственного интеллекта

Что вообще такое искусственный интеллект?

Если говорить именно про искусственный интеллект, то главное здесь — создание систем, которые будут, как и человек, обучаться на основе взаимодействия с примерами из реального мира. Грубо говоря, если отправить нас во Францию без знания языка, рано или поздно мы его освоим, даже не беря в руки учебник, просто погрузившись в среду.

Было много разных идей, как дать компьютеру подобную возможность. Сегодня под искусственным интеллектом понимается конкретный раздел компьютерных наук — машинное обучение, которое занимается извлечением алгоритмов и знаний из данных. Например, есть тексты на русском языке и их профессиональные переводы на английский. Благодаря технологиям машинного обучения компьютер анализирует эти примеры и создаёт алгоритм для перевода текстов. Так работает Яндекс Переводчик.

Какие AI существуют?

Сейчас есть два взаимно обусловленных направления в AI. Первый — это классическое машинное обучение (Machine Learning, ML), когда существуют табличные данные, например, о клиентах банка. На их основе создаются алгоритмы вроде градиентного бустинга для прогностического анализа. Эти подходы хорошо изучены, они дают не очень сложные алгоритмы, которые надёжно работают, например, в поисковых машинах.

Вахрушев Антон, разработчик AI Lab

Но бывают задачи более сложные, где на входе и выходе алгоритма есть текст, фото, видео, звук. И там классический подход не очень-то применим. Вот здесь и выходит на сцену глубокое обучение (Deep Learning, DL) — метод, предполагающий самостоятельное выстраивание общих правил в виде нейронной сети на примере данных во время процесса обучения, автоматическое выявление огромного количества правил и характеристик. Например, в задаче определения возраста по фотографии нейросеть сама должна понять на основе данных, что надо искать морщины, седину, текстуру кожи, тем самым обучаясь, выявляя эти характеристики и определяя с их помощью возраст.

Значит, нейросеть — это AI?

По сути, нейросеть — это большая формула, в которой могут быть сотни миллиардов и триллионы слагаемых, множителей и так далее. Так что её корректно называть составной частью AI. А когда в рекламе нам говорят, что некий банк с помощью искусственного интеллекта научился выявлять мошенников, это значит, что выстроена нейронная сеть или какой-то другой алгоритм на основе машинного обучения, которые работают с большой базой данных и способны находить закономерности.

Почему иногда говорят о «слабом» и «сильном» AI? Это не IQ?

Слабый искусственный интеллект — это алгоритм, какая-то программа, которая решает одну конкретную задачу: например, ищет в интернете статьи или по фото определяет возраст человека. Слабый AI было бы уместно называть специализированным.

Вахрушев Антон, разработчик AI Lab

Главный критерий для сильного искусственного интеллекта — возможность самостоятельного обучения новым задачам. Допустим, программа умеет определять возраст по фотографии, а если ей дать другие примеры, она сможет определять место рождения человека. Такой программы пока не существует, сильный AI сейчас — это гипотетическая технология. Сегодня, когда речь заходит про сильный искусственный интеллект, скорее пытаются среди решённых задач найти алгоритм, который хотя бы немного выйдет за пределы слабого AI. Некоторые исследователи считают, что шаг к сильному AI — это мультимодальные алгоритмы, которые умеют работать с разными типами данных, например со звуком, текстом и изображением. Но даже такие алгоритмы решают конкретные задачи, они не способны самообучаться.

Приблизились ли современные AI к прохождению теста Тьюринга?

Тест Тьюринга — эмпирический тест, предложенный Аланом Тьюрингом в 1950 году. Интерпретация теста звучит так: если машина отвечает на заданные вопросы так, что человек не в состоянии определить, общается он с другим человеком или с компьютером, тест считается пройденным.

Вполне — если под интеллектом понимать способность условной GPT-нейросети поддерживать беседу с человеком на сложные темы. Возьмём произвольный диалог в мессенджере. Нейронная сеть вполне может его сымитировать: поговорить про погоду, спросить, как дела, ответить на технические вопросы. Сегодня нейросеть способна ввести человека в заблуждение. И этого, в отличие от «Скайнета», действительно стоит бояться. Уже довольно много говорят о том, что с помощью генеративных сетей сейчас имитируют обращения в службу поддержки компаний, тем самым перегружая их.

Где используют этот интеллект?

Сейчас искусственный интеллект и его алгоритмы используют и активно развивают крупные IT-корпорации. Сервисы поиска, стриминга, такси и курьерской доставки без AI уже трудно представить. Любой популярный сервис Яндекса использует его: в Поиске машинное обучение нужно, чтобы улучшать выдачу и показывать релевантную рекламу, в Кинопоиске или Яндекс Музыке ML на основе предпочтений пользователя предлагает то, что ему будет интересно посмотреть или послушать. В Яндекс Go машинное обучение прогнозирует спрос, эффективно распределяет курьеров или таксистов по району.

Компаниям, которые изначально были в других секторах, например в медицине, сложнее внедрять AI. Это требует полной перестройки всех процессов. Когда врачи по всей стране уже работают по отлаженной схеме, непросто встроить интеллектуальные алгоритмы в процесс постановки диагноза. Конечно, большим корпорациям, даже не из сферы IT, гораздо проще. Пока AI — это экспериментальная технология, которая требует дорогостоящих специалистов и серьёзных вычислительных ресурсов. Но постепенно фокус смещается, ресурсы и специалисты становятся доступнее, а значит, и технология получит широкое распространение.

Если искусственный интеллект такой классный, почему его не используют повсюду?

Ключевая проблема — отсутствие данных. Невозможно сделать качественный алгоритм, например, для постановки медицинского диагноза, если у нас нет огромных объёмов информации о пациентах с известными болезнями. И далеко не во всех областях они имеются. Сюда же можно отнести проблему с персональными данными. С одной стороны, они необходимы для обучения моделей AI. У всех компаний есть стимул узнавать про нас как можно больше, чтобы зарабатывать на информации. С другой стороны, чем больше компании про нас знают, тем выше риск утечки этих данных и их неправомерного использования. Как сделать так, чтобы IT-сфера не откатилась в прошлое, но при этом наши данные были более защищены и не принадлежали корпорациям, — открытый вопрос.

Второй вызов обусловлен тем, что многие решения на основе AI уже сегодня лишают людей работы. Например, какую-то задачу работника службы поддержки можно автоматизировать. Или скоро доведут до ума беспилотные автомобили — и миллионы таксистов окажутся не нужны. Это серьёзная социальная проблема. Неудивительно, что в компаниях AI внедряется крайне осторожно: мало кто хочет автоматизировать свою же работу. Но, как это было в истории промышленных революций, новые технологии часто создают и новые рабочие места.

А ещё есть страх, связанный с генеративными моделями, которые сейчас могут писать картины, создавать тексты и так далее. Мы вступаем в эпоху, когда интернет будет легко заполонить абсолютно фейковой информацией, а ориентироваться в этом станет сложнее. Это не затормозит повсеместное внедрение AI, но даёт повод волноваться.

Вахрушев Антон, разработчик AI Lab

Куда пойти учиться на разработчика ИИ?

На данный момент есть огромное количество курсов и направлений обучения, связанных с искусственным интеллектом. Например, инженер-данных, разработчик или аналитик. Они все одинаково важны в этой сфере, единственный момент заключается в том, что вам нравится больше, исследовать данные, строить их архитектуру или разрабатывать саму оболочку для ИИ. Есть множество способов понять, что вам ближе, но я рекомендую пройти простой тест, который не требует специальных знаний. Отвечая на вопрос, куда пойти учиться, хочется отметить, что в наше время нет ограничений по возрасту и уровне знаний в области программирования. Есть направления практически во всех университетах, а также онлайн платформы как платные, так и бесплатные с нулевым порогом знаний. Но пользуясь случаем, хочу обратить ваше внимание на платформу AI Lab, в экосистеме которой я работаю. Может быть, через несколько лет с кем-нибудь из наших читателей совершим большое научное открытие в области искусственного интеллекта!

11