Что ждет искусственный интеллект в 2024 году: 4 главных тренда от MIT

Эти тренды имеют вполне практическое значение для нас, обычных пользователей. К оценкам Массачусетского технологического института (MIT) стоит прислушаться: их прогнозам на 2023 год сбылись почти в полном объеме, и текущие прогнозу, к слову, уже начали сбываться.

За пределами прогноза остались очевидное: что большие языковые модели будут продолжать доминировать,что регуляторы станут смелее, а проблемы ИИ будут определять повестку дня для исследователей.

MIT (Massachusetts Institute of Technology) — одно из самых престижных технических учебных заведений США и мира. MIT занимает лидирующие позиции в престижных рейтингах университетов мира, является новатором в областях робототехники и искусственного интеллекта, а его образовательные инженерные программы из года в год признаются лучшими в США.

Вот главные тренды развития ИИ:

1. Персональные чат-боты

В 2024 году технологическим компаниям, которые вложили значительные средства в генеративный ИИ, придется доказать, что они могут зарабатывать деньги на своих продуктах. Для этого гиганты ИИ, такие как Google и OpenAI, делают большую ставку на кастомизированные решения. Оба разрабатывают удобные платформы, которые позволяют людям настраивать мощные языковые модели и создавать свои собственные мини-чат-боты под их конкретным потребности, без навыков программирования.

Google и OpenAI запустили веб-инструменты, которые позволяют любому стать разработчиком приложений с генеративным ИИ.

В 2024 году генеративный ИИ может действительно стать полезным для обычного человека, не разбирающегося в технологиях, и мы увидим, как больше людей возятся с миллионом маленьких моделей ИИ. Модели искусственного интеллекта, такие как GPT-4 или Gemini, являются мультимодальными, то есть могут обрабатывать не только текст, но и изображения и даже видео. Эта может открыть целый ряд новых возможностей.

Например, агент по недвижимости может загрузить текст из своих предыдущих объявлений и настроить модель для создания аналогичного текста одним нажатием кнопки. А затем загрузить видео и фотографии новых объявлений и попросить ИИ создать описание для своего нового объекта.

Конечно, успех зависит от того, будут ли эти модели работать надежно. Языковые модели часто выдумывают, а генеративные модели пронизаны предубеждениями. Их легко взломать, особенно если им разрешено просматривать веб-страницы. Технологические компании пока не решили ни одну из этих проблем.

2. Видео — вторая волна генеративного ИИ

Удивительно, как быстро новое становится привычным! Первые генеративные модели для создания изображений стали мейнстримом в 2022 году. Изображения от DALL-E от OpenAI, Stable Diffusion от Stability AI и Firefly от Adobe, наводнили Интернет картинками от Папы в Баленсиаге до произведений искусства, удостоенных наград.

Дипфейк Папы в Баленсиаге. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.nytimes.com%2F2023%2F04%2F08%2Ftechnology%2Fai-photos-pope-francis.html&postId=1025087" rel="nofollow noreferrer noopener" target="_blank">Источник</a><br />
Дипфейк Папы в Баленсиаге. Источник

Новый рубеж — преобразование текста в видео. Год назад результаты были так себе, но технология быстро улучшается.

Прогноз MIT уже стал сбываться: в конце января Google представила нейросеть Lumiere, которая генерит видео по картинке или текстовому запросу

Runway, стартап, создающий генеративные видеомодели (и компания, которая создала Stable Diffusion), выпускает новые версии своих инструментов каждые несколько месяцев. Последняя модель Gen-2 по-прежнему генерирует видео длительностью всего несколько секунд, но качество просто поражает. Лучшие клипы не так уж далеки от того, что делает Pixar.

Киногиганты, например, Paramount и Disney, изучают возможность использования генеративного ИИ в своих производственных процессах. Эта технология уже используется для дубляжа, и это заново открывает возможности спецэффектов.

Runway организовал ежегодный фестиваль фильмов об ИИ, на котором демонстрируются экспериментальные фильмы, снятые с использованием различных инструментов ИИ. В этом году призовой фонд фестиваля составляет $60 000, а 10 лучших фильмов будут показаны в Нью-Йорке и Лос-Анджелесе.

В 2023 году в фильме «Индиана Джонс и циферблат судьбы» главную роль сыграл пожилой дипфейк Харрисона Форд. Это только начало.

За пределами большого экрана также набирают популярность технологии дипфейков для маркетинговых или обучающих целей. Например, британская Synthesia создает инструменты, которые могут превратить разовое выступление актера в бесконечный поток дипфейковых аватаров, повторяющих любой сценарий, который вы им зададите, одним нажатием клавиши. По данным компании, ее технологию сейчас используют 44% компаний из списка Fortune 100.

Возможность сделать так много с такими малыми средствами ставит перед актерами серьезные вопросы. Обеспокоенность по поводу использования и неправильного использования ИИ студиями лежала в основе забастовок SAG-AFTRA в прошлом году. Но истинное влияние технологии только предстоит открыть.

3. Электоральная дезинформация, созданная искусственным интеллектом, будет повсюду

Дезинформация и дипфейки, созданные искусственным интеллектом, станут огромной проблемой, поскольку в 2024 году на выборах сможет участвовать свыше половины населения планеты. Мы уже видим, как политики используют эти инструменты в качестве оружия.

Самый свежий пример — в конце января 2024 г. созданный с помощью технологии дубляжа от ElevenLab аудиодипфейк президента США Джо Байдена призывал людей не голосовать на праймериз в Нью-Гэмпшире.

Становится труднее распознать, что именно реально в Интернете. В уже накаленном и поляризованном политическом климате это может иметь серьезные последствия.

Всего несколько лет назад создание дипфейка потребовало бы передовых технических навыков, но генеративный искусственный интеллект сделал это до безумия простым и доступным, а результаты выглядят все более реалистичными.

Наступающий год станет решающим для тех, кто борется с распространением такого контента. Методы отслеживания и смягчения последствий его содержания все еще находятся на ранней стадии разработки. OpenAI буквально недавно ввел маркировку контента (хотя и признает, что это не является панацеей) и отказывает в создании изображений реальных людей. Социальные сети, как известно, очень медленно устраняют дезинформацию (см. свежий кейс с Тейлор Свифт). Есть и "безобидные" дипфейки, с помощью которых их создатели зарабатывают деньги - например, кейс с красоткой Эмили с сотней тысяч подписчиков.

А мы готовимся к масштабному эксперименту в реальном времени по разоблачению фейковых новостей, созданных ИИ.

4. Мультизадачные роботы

Вдохновленные достижениями генИИ, робототехники начинают создавать роботов, способных выполнять более широкий спектр задач.

За последние несколько лет в сфере ИИ произошел переход от использования множества небольших моделей, каждая из которых обучена выполнять разные задачи (идентифицировать изображения, рисовать и пр.), к единым моделям, обученным делать все это и многое.

Мультимодальные модели, такие как GPT-4 и Gemini от Google DeepMind, могут решать как визуальные, так и лингвистические задачи. Тот же подход может работать и для роботов, поэтому не нужно будет обучать одного переворачивать блины, а другого - открывать двери: универсальная модель может дать роботам возможность выполнять несколько задач. В 2023 году появилось несколько примеров работ в этой области.

Проблема в развитии робототехники — в недостатке данных. Генеративный ИИ использует набор данных размером с весь интернет. У роботов очень мало хороших источников данных, которые могли бы помочь им научиться выполнять многие промышленные или домашние задачи, которые мы от них хотим.

Кажется, что и с проблемой недостатка данных для обучения роботов нашли решение: ученые из Стэнфорда нашли возможность обучать роботов путем повторения действий учителя.

Леррел Пинто из Нью-Йоркского университета и его коллеги разрабатывают методы, которые позволяют роботам учиться методом проб и ошибок, по ходу производя собственные данные для обучения. За последние пару лет крупные компании также начали публиковать большие наборы данных для обучающих роботов.

Этот подход уже показал себя многообещающе и в беспилотных автомобилях. Сейчас стартап Wayve тестирует свои беспилотные автомобили на узких оживленных улицах Лондона.

Пожалуйста, поддержите меня, поставьте лайк!

11
Начать дискуссию