реклама
разместить

ИИ агент от OpenAI может появиться очень скоро

Расскажу, чего ожидать от этого агента

🔥 Еще больше интересного в моем канале продуктовые штучки

OpenAI, возможно, близки к выпуску инструмента, который сможет взять под контроль ПК и выполнять действия от вашего имени (это суть агентов, подробнее о них — тут).

В медиа наводят шум, но на самом деле, компания анонсировала это недавно сама, когда выпускала функцию напоминания.

Неизбежный выход OpenAI на рынок агентов ИИ происходит на фоне конкурентов, включая вышеупомянутую Anthropic, Google и других, которые пытаются завоевать этот зарождающийся сегмент. Рынок агентов по всем прогнозам будет бурно расти в 2025 году, и мы это уже наблюдаем. По данным аналитической компании Markets and Markets, к 2030 году рынок агентов ИИ может составить $47,1 млрд.

Тибор Блахо, инженер-программист с репутацией слива будущих продуктов ИИ, утверждает, что обнаружил доказательства давно обсуждаемого инструмента Operator от OpenAI (как говорят, он и является «агентской» системой, способной автономно выполнять такие задачи, как написание кода и бронирование путешествий).

Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2Fbtibor91%2Fstatus%2F1881110210867290191&postId=1765868" rel="nofollow noreferrer noopener" target="_blank">Х</a><br />
Источник: Х

Согласно The Information, OpenAI нацеливается на январь в релизе Operator.

Какова производительность ИИ агента?

Нужно понимать, что агенты сегодня довольно примитивны. Но некоторые эксперты выразили обеспокоенность по поводу их безопасности, если технология будет быстро совершенствоваться.

Нужно оговориться, что OpenAI пока не опубликовал данные производительности Operator по сравнению с другими инструментами, и это неофициальные данные.

На OSWorld (бенчмарке, который пытается имитировать реальную компьютерную среду, «OpenAI Computer Use Agent (CUA)» — возможно, модель ИИ, лежащая в основе Operator — набирает 38,1%, опережая ИИ агента Anthropic, но значительно отстает от человеческого результата в 72,4%.

OpenAI CUA превосходит человеческую производительность на WebVoyager, который оценивает способность ИИ перемещаться и взаимодействовать с веб-сайтами. Но эта модель не дотягивает до человеческих результатов на другом веб-бенчмарке, WebArena, согласно просочившимся бенчмаркам.

Оценка ИИ агентов. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2Fbtibor91%2Fstatus%2F1881285255266750564%3Fref_src%3Dtwsrc%255Etfw%257Ctwcamp%255Etweetembed%257Ctwterm%255E1881285255266750564%257Ctwgr%255Ee9a19bc3edef0d0cf16cc0634865bbcc91289b7b%257Ctwcon%255Es1_%26amp%3Bref_url%3Dhttps%253A%252F%252Ftechcrunch.com%252F2025%252F01%252F20%252Fopenais-agent-tool-may-be-nearing-release%252F&postId=1765868" rel="nofollow noreferrer noopener" target="_blank">Х</a>
Оценка ИИ агентов. Источник: Х

Operator также (пока) испытывает трудности с задачами, которые легко может выполнить человек, если верить утечке.

В тесте, в котором Operator должен был зарегистрироваться у облачного провайдера и запустить виртуальную машину, Operator справился только в 60% случаев. В тесте на создание биткойн-кошелька Operator справился только в 10% случаев.

Оценка ИИ агентов. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2Fbtibor91%2Fstatus%2F1881285255266750564%3Fref_src%3Dtwsrc%255Etfw%257Ctwcamp%255Etweetembed%257Ctwterm%255E1881285255266750564%257Ctwgr%255Ee9a19bc3edef0d0cf16cc0634865bbcc91289b7b%257Ctwcon%255Es1_%26amp%3Bref_url%3Dhttps%253A%252F%252Ftechcrunch.com%252F2025%252F01%252F20%252Fopenais-agent-tool-may-be-nearing-release%252F&postId=1765868" rel="nofollow noreferrer noopener" target="_blank">Х</a>
Оценка ИИ агентов. Источник: Х

Operator хорошо справляется с оценками безопасности, включая тесты, которые пытаются заставить систему выполнять «незаконные действия» и искать «конфиденциальные персональные данные».

Оценка ИИ агентов с точки зрения безопасности. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2Fbtibor91%2Fstatus%2F1881285255266750564%3Fref_src%3Dtwsrc%255Etfw%257Ctwcamp%255Etweetembed%257Ctwterm%255E1881285255266750564%257Ctwgr%255Ee9a19bc3edef0d0cf16cc0634865bbcc91289b7b%257Ctwcon%255Es1_%26amp%3Bref_url%3Dhttps%253A%252F%252Ftechcrunch.com%252F2025%252F01%252F20%252Fopenais-agent-tool-may-be-nearing-release%252F&postId=1765868" rel="nofollow noreferrer noopener" target="_blank">Х</a>
Оценка ИИ агентов с точки зрения безопасности. Источник: Х

Как сообщается , тестирование безопасности является одной из причин длительного цикла разработки Operator.

Пожалуйста, поддержите меня, поставьте лайк! 🙏

33
реклама
разместить
5 комментариев

Представляю, как это упростит выполнение рутинных задач на компьютере. Но немного страшно, что ИИ будет сам принимать решения. Надеюсь, у них там все под контролем с безопасностью.

Интересно, как это будет работать на практике. Смогу ли я просто сказать: "Забронируй мне билеты в Рим на следующие выходные", и он все сделает сам? Или нужно будет давать более точные инструкции? И сколько это будет стоить?

Пока это все выглядит как красивые обещания. Посмотрим, что будет на деле. Утечки и бенчмарки – это одно, а реальная работа – совсем другое. Сомневаюсь, что он будет работать идеально с первого раза.

Меня больше всего беспокоит вопрос безопасности. Как они собираются защищать мои данные, если ИИ будет иметь доступ к моему компьютеру? И что, если он начнет делать что-то не то? Это очень серьезные вопросы.

Это будет доступно только для разработчиков или для обычных пользователей тоже? И какие системные требования будут? Надеюсь, не нужно будет покупать супер-мощный компьютер.

Размышления С.Альтмана об общем искусственном интеллекте и том, как он изменит мир

Это эссе – рефлексия на тему общего искусственного интеллекта (AGI). Он уже появляется на горизонте, и поэтому Альтман считает важным понимать, в каком моменте мы находимся. И эти размышления кажутся и обоснованными, и фантастичными одновременно.

Возможно, через десятилетие любой человек на Земле сможет добиться большего, чем самый влиятельный человек сегодня.

С. Альтман
44
11
Что ждет ИИ в 2025 году

Прогноз от MIT Technology Review. Расскажу, кто уже являются первопроходцами и в каких направлениях ждать новостей.

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.technologyreview.com%2F2025%2F01%2F08%2F1109188%2Fwhats-next-for-ai-in-2025%2F&postId=1751049" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
33
Яндекс Карты 2025: обзор новых категорий в "Хорошем месте". Какие категории актуальнее?

Сегодня только видео и фото. В видео рассмотрел все новые категории, с точки зрения необходимости "Хорошего места". Взял за город-мерило – Ярославль (население 567 443).
Метрики: спрос, социальность, первичная необходимость, отношение к развитию бизнеса и сервиса Яндекс Бизнес.

OpenAI представили Operator: автономных ИИ-агентов
OpenAI представили Operator: автономных ИИ-агентов

До официального релиза некоторые пользователи подписки Pro уже начали делиться впечатлениями. В их интерфейсе появился раздел Operator, после чего в системе произошел масштабный сбой - явление, которое зачастую предвещает скорое появление новых релизов.

88
Разошлёт письма, закажет билеты и развернёт приложение: какие задачи пользователи дают новому ИИ-агенту от OpenAI

Собрали первые примеры и наблюдения.

3838
77
44
22
11
Молодцы... Сами же открыли ящик Пандоры. Все же понимают. к чему это приведёт. Интернет можно хоронить. Профили в соц. сетях, отзывы на картах, покупки и отзывы на маркетплейсах, сами товары и их описание, фото, комментарии, обсуждения, вопросы, музыка, фильмы, видео, фото, новости, статьи — всё это будет генерировать нейросеть. А люди всё это будут жрать. И никто не разберётся, нейросеть это сгенерировала или человек. Да и у вас просто не будет возможности разобраться: с учётом скорости генерации 99.9999% контента будет сгенерировано нейросетью. Весь интернет превратится с одну большую свалку. Всё это закончится либо уничтожением интернета в привычном формате, либо уже вход в интернет по паспорту или биометрии. Чтобы сразу было понятно, что вошёл настоящий человек. Нифига мне такое будущее не нравится.
Как ИИ-агенты преобразили бизнес в 2024 году и что ждет нас в 2025-м

И уже в 2025 году, по прогнозам аналитиков, нас ждет более масштабное развертывание этих технологий. Бизнес ждет реальную отдачу от пилотных проектов, а разработчики планируют упростить «оркестровку» (управление) множеством различных ИИ-модулей и агента-ориентированных сервисов. Ниже мы подробно разберем, почему 2024-й стал «переломным» для ИИ-аген…

@HumanReadyTech
11
В ChatGPT теперь можно устанавливать напоминания и повторяющиеся задачи
<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ftechcrunch.com%2F2025%2F01%2F14%2Fchatgpt-now-lets-you-schedule-reminders-and-recurring-tasks%2F&postId=1755317" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
77
ChatGPT теперь может провести для вас «глубокое исследование»

Расскажу, что может и кому доступен

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.theverge.com%2Fnews%2F604902%2Fchagpt-deep-research-ai-agent&postId=1790940" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
88
11
Что такое ИИ агенты❓

Давайте на пальцах разбираться как ИИ агенты выводят производительность и инновации на новый уровень. От автоматизации повторяющихся задач до преобразования рабочих процессов.

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.bcg.com%2Fcapabilities%2Fartificial-intelligence%2Fai-agents%3Futm_source%3Dchatgpt.com&postId=1803695" rel="nofollow noreferrer noopener" target="_blank">Что такое </a>ИИ агенты 
11
11
реклама
разместить
OpenAI представила AI-агента Operator: начало новой эры автоматизации?

OpenAI запустила нового AI-агента Operator, который способен выполнять повседневные задачи в интернете: бронировать столики в ресторанах, заказывать товары и даже заполнять различные формы. Новинка пока доступна только подписчикам ChatGPT Pro в США, но уже вызвала большой интерес.

Посмотрите на наше ближайшее будущее

Два агента на базе искусственного интеллекта переходят в общении друг с другом на "птичий" язык

44
11