Роботы учатся, чат-боты визуализируют: каким 2024 год будет для ИИ ‘скачком вперед’

Роботы учатся, чат-боты визуализируют: каким 2024 год будет для ИИ ‘скачком вперед’

ИИ будет развиваться быстрыми темпами, становясь все более могущественным и распространяясь в физическом мире.

На мероприятии в Сан-Франциско в ноябре Сэма Альтмана, исполнительного директора компании OpenAI, занимающейся искусственным интеллектом, спросили, какие сюрпризы преподнесет отрасль в 2024 году.

Онлайн-чат-боты, такие как ChatGPT от OpenAI, совершат “скачок вперед, которого никто не ожидал”, - немедленно отреагировал мистер Альтман.

Сидевший рядом с ним Джеймс Маниика, исполнительный директор Google, кивнул и сказал: “Плюс один к этому”.

Индустрию ИИ в этом году будет определять одна главная характеристика: удивительно быстрое совершенствование технологий по мере того, как достижения дополняют друг друга, позволяя ИИ создавать новые виды медиа, по-новому имитировать человеческое мышление и проникать в физический мир с помощью роботов нового поколения.

В ближайшие месяцы генераторы изображений на базе ИИ, такие как DALL-E и Midjourney, будут мгновенно доставлять видео, а также неподвижные изображения. И они постепенно сольются с чат-ботами, такими как ChatGPT.

Это означает, что чат-боты выйдут далеко за рамки цифрового текста, обрабатывая фотографии, видео, диаграммы и другие носители информации. Они будут демонстрировать поведение, которое больше похоже на человеческие рассуждения, решая все более сложные задачи в таких областях, как математика и естественные науки. По мере того, как технологии внедряются в роботов, это также поможет решать проблемы за пределами цифрового мира.

Многие из этих разработок уже начали появляться в ведущих исследовательских лабораториях и в технологических продуктах. Но в 2024 году мощность этих продуктов значительно возрастет, и ими будет пользоваться гораздо больше людей.

“Быстрый прогресс ИИ будет продолжаться”, - сказал Дэвид Луан, исполнительный директор Adept, стартапа в области ИИ. “Это неизбежно”.

OpenAI, Google и другие технологические компании продвигают искусственный интеллект гораздо быстрее, чем другие технологии, благодаря способу построения базовых систем.

Большинство программных приложений создаются инженерами, по одной строке компьютерного кода за раз, что обычно является медленным и утомительным процессом. Компании быстрее совершенствуют искусственный интеллект, потому что технология основана на нейронных сетях, математических системах, которые могут обучаться навыкам путем анализа цифровых данных. Выявляя закономерности в таких данных, как статьи Википедии, книги и цифровые тексты, взятые из Интернета, нейронная сеть может научиться генерировать текст самостоятельно.

В этом году технологические компании планируют предоставить системам искусственного интеллекта больше данных, включая изображения, звуки и текст, чем люди могут себе представить. По мере того, как эти системы будут изучать взаимосвязи между этими различными видами данных, они научатся решать все более сложные проблемы, подготавливая их к жизни в физическом мире.

(В прошлом месяце New York Times подала в суд на OpenAI и Microsoft за нарушение авторских прав на новостной контент, связанный с системами искусственного интеллекта.)

Все это не означает, что ИИ в ближайшее время сможет сравняться с человеческим мозгом. Хотя компании ИИ и предприниматели стремятся создать то, что они называют “общим искусственным интеллектом” — машину, которая может делать все, что может человеческий мозг, — это остается сложной задачей. Несмотря на все свои быстрые успехи, ИИ остается на ранних стадиях.

Вот руководство о том, как ИИ собирается измениться в этом году, начиная с достижений в ближайшей перспективе, которые приведут к дальнейшему развитию его способностей.

Мгновенные видеоролики

До сих пор приложения на базе ИИ в основном генерировали текст и неподвижные изображения в ответ на запросы. DALL-E, например, может создавать фотореалистичные изображения за считанные секунды по таким запросам, как “носорог, ныряющий с моста Золотые ворота”.

Но в этом году такие компании, как OpenAI, Google, Meta и нью-йоркская Runway, вероятно, внедрят генераторы изображений, которые позволят людям создавать и видео. Эти компании уже создали прототипы инструментов, которые могут мгновенно создавать видеоролики из коротких текстовых подсказок. Кстати это уже появилось.

Технологические компании, вероятно, будут использовать возможности генераторов изображений и видео в чат-ботах, делая чат-ботов более мощными.

‘Мультимодальные’ чат-боты

Чат-боты и генераторы изображений, изначально разработанные как отдельные инструменты, постепенно объединяются. Когда в прошлом году OpenAI дебютировала с новой версией ChatGPT, чат-бот мог генерировать изображения, а также текст.

Компании ИИ создают “мультимодальные” системы, что означает, что ИИ может обрабатывать несколько типов носителей. Эти системы обучаются навыкам, анализируя фотографии, текст и, возможно, другие виды медиа, включая диаграммы, графические изображения, звуки и видео, чтобы затем создавать свои собственные тексты, изображения и звуки.

Это еще не все. Поскольку системы также изучают взаимосвязи между различными типами медиа, они смогут понимать один тип медиа и реагировать с помощью другого. Другими словами, кто-то может отправить изображение в чат-бота, и он ответит текстом.

“Технология станет умнее и полезнее”, - сказал Ахмад Аль-Дахле, который возглавляет группу генеративного ИИ в Meta. “Она будет делать больше вещей”.

Мультимодальные чат-боты будут ошибаться точно так же, как текстовые чат-боты допускают ошибки. Технологические компании работают над сокращением количества ошибок, стремясь создавать чат-ботов, которые могут рассуждать как люди.

Лучшие ‘Рассуждения’

Когда г-н Альтман говорит об ИИ, совершающем скачок вперед, он имеет в виду чат-ботов, которые лучше “рассуждают”, поэтому они могут выполнять более сложные задачи, такие как решение сложных математических задач и создание подробных компьютерных программ.

Цель состоит в создании систем, способных тщательно и логично решать проблему с помощью серии дискретных шагов, каждый из которых основывается на следующем. Именно так рассуждают люди, по крайней мере, в некоторых случаях.

Ведущие ученые расходятся во мнениях относительно того, действительно ли чат-боты могут рассуждать подобным образом. Некоторые утверждают, что эти системы просто кажутся рассуждающими, поскольку они повторяют поведение, которое они видели в данных Интернета. Но OpenAI и другие компании создают системы, которые могут более надежно отвечать на сложные вопросы, связанные с такими предметами, как математика, компьютерное программирование, физика и другие науки.

“По мере того, как системы становятся более надежными, они будут становиться все более популярными”, - сказал Ник Фросст, бывший исследователь Google, который помогает руководить Cohere, стартапом в области искусственного интеллекта.

Если чат-боты будут лучше рассуждать, они смогут превратиться в “агентов ИИ”.

‘Агенты ИИ’

По мере того, как компании поэтапно обучают системы искусственного интеллекта решать сложные проблемы, они также могут улучшить способность чат-ботов использовать программные приложения и веб-сайты от вашего имени.

Исследователи, по сути, превращают чат-ботов в новый вид автономной системы, называемой ИИ-агентом. Это означает, что чат-боты могут использовать программные приложения, веб-сайты и другие онлайн-инструменты, включая электронные таблицы, онлайн-календари и туристические сайты. Тогда люди могли бы переложить утомительную офисную работу на чат-ботов. Но эти агенты также могут полностью лишить рабочих мест.

Чат-боты уже действуют как небольшие агенты. Они могут планировать встречи, редактировать файлы, анализировать данные и строить гистограммы. Но эти инструменты не всегда работают так хорошо, как нужно. Агенты полностью выходят из строя при выполнении более сложных задач.

В этом году компании, занимающиеся ИИ, намерены представить более надежных агентов. “Вы должны иметь возможность делегировать агенту любую утомительную повседневную компьютерную работу”, - сказал г-н Луан.

Это может включать отслеживание расходов в приложении, таком как QuickBooks, или регистрацию дней отпуска в приложении, таком как Workday. В долгосрочной перспективе это выйдет за рамки программного обеспечения и интернет-сервисов и распространится на мир робототехники.

Умные роботы

В прошлом роботы были запрограммированы на выполнение одной и той же задачи снова и снова, например, поднимать коробки всегда одинакового размера и формы. Но используя те же технологии, что лежат в основе чат-ботов, исследователи наделяют роботов способностью решать более сложные задачи, включая те, которые они никогда раньше не видели.

Точно так же, как чат-боты могут научиться предсказывать следующее слово в предложении, анализируя огромное количество цифрового текста, робот может научиться предсказывать, что произойдет в физическом мире, анализируя бесчисленные видеозаписи, на которых объекты трогают, поднимают и перемещают.

“Эти технологии могут поглощать огромные объемы данных. И по мере того, как они усваивают данные, они могут узнать, как устроен мир, как работает физика, как вы взаимодействуете с объектами ”, - сказал Питер Чен, бывший исследователь OpenAI, который руководит Covariant, стартапом в области робототехники.

В этом году искусственный интеллект будет способствовать развитию роботов, которые выполняют работу за кулисами. Например, механические руки будут складывать рубашки в прачечной самообслуживания или сортировать вещи на складе.Технологические лидеры, такие как Илон Маск, работают над тем, чтобы человекоподобные роботы могли помогать людям в их домах.

Компания AIRPA разрабатывает передовых ботов на основе искусственного интеллекта. Мы предлагаем услуги по созданию чат-ботов любой сложности с использованием самых современных технологий.

Среди наших услуг:

* Боты на основе GPT-4 и GPT-3 с возможностью дополнительного обучения.

* Интеграция моделей генерации изображений, таких как Stable Diffusion, DALL-E и Midjourney.

* Голосовые помощники с поддержкой речевого ввода и синтеза речи.

* Боты на Python с открытыми API для расширения функционала.* Парсеры и сборщики данных из интернета.

* Разработка custom нейронных сетей для решения уникальных задач с возможностью дополнительного обучения

📋 Мои данные:

Бесплатно консультирую по внедрению CRM, чат-ботов и созданию голосовых роботов с искусственным интеллектом. Пишите лично мне в Whatsapp или в Telegram @odintsov

📋 Мои ТОПовые публикации:

Начать дискуссию