А что собственно происходит? Сразу три крутых апдейта за 3 часа!

Похоже у разработчиков AI синхронизировались релизные циклы 😁

Два часа назад вышел новый Claude Opus 4.6.

Больше ризонинга, дольше работает самостоятельно, контекстное окно в 1 млн токенов, можно контролировать «силу размышлений» или давать модели самой решить в режиме «adaptive thinking».

Из интересного:

Сделали упор на рабочие некодинговые задачи, апгрейднули способности в Excel, выкатили интеграцию с PowerPoint. Логичное продолжение темы с Claude Cowork.
Сильно улучшили работу с контекстом — теперь модель будет эффективнее сжимать контекст и лучше находить в нем информацию, что в купе с большим контекстным окном должно дать крутой эффект.
Добавили «команды агентов» — можно запускать параллельно несколько агентов, у каждого из которых своя сессия, а значит независимый «мыслительный процесс». А еще эти агенты будут между собой переписываться и делить задачи, а не дублировать друг друга.

Похоже Claude Opus 4.6 — новый царь горы! 🤴

Час назад выкатили новый GPT-5.3-Codex.

Как всегда — быстрее (на 25%), выше (по всем агентном бенчмаркам по версии OpenAI), сильнее (думает и коллаборирует с разработчиком). OpenAI заявляют новую модель как лучшую на текущий момент для кодинга и агентных задач.

Из интересного:

Тоже большой акцент сделали на использование Codex для некодинговых задач. Мол презентацию сделает, PRD напишет, табличку составит. Видимо, ответка на Claude Cowork.
А ещё бьют себя в грудь, что это самая заточенная под задачи в области кибербеза. Модель специально учили искать уязвимости в ПО.

А ещё маркетинговая фишка — ранние версии 5.3-Codex использовали в процессе разработки более поздних версий самой себя. Вот такая вот рекурсия…

Похоже GPT-5.3-Codex — новый царь горы! 🤴

А, я это уже говорил?

В общем, по версии Клода — лучшая агентная модель у них, по версии OpenAI — у них. Ну и конечно с таким таймингом релиза мы пока не знаем, кто в итоге новый лидер по бенчмаркам AI для кодинга и агентных задач 😄

А может в этом и был план?! Не нужно спешить с разработкой новой модели, оба релизнулись, оба молодцы, никто не проиграл, никто не выиграл. Перед инвесторами все отчитались. Разработчики отпуск возьмут наконец-то 🤓

И как вишенка на торте — три часа назад Perplexity представил Model Council.

Фича дает возможность запускать параллельно 3 модели на выбор. Потом результаты сравниваются моделью-композером, и сравнительный анализ и саммари возвращается юзеру.

Похоже, что в новом Claude Opus можно реализовать такую же штуку. Но Perplexity мы любим за разнообразие моделей — поэтому на мой взгляд, фича все равно круче, чем просто прогон команды из трех агентов Claude.

Отличный способ перепроверки для снижения количества галлюцинаций.

Заместители

Подписывайтесь на Telegram Заместители.