А что собственно происходит? Сразу три крутых апдейта за 3 часа!
Похоже у разработчиков AI синхронизировались релизные циклы 😁
- Два часа назад вышел новый Claude Opus 4.6.
Больше ризонинга, дольше работает самостоятельно, контекстное окно в 1 млн токенов, можно контролировать «силу размышлений» или давать модели самой решить в режиме «adaptive thinking».
Из интересного:
- Сделали упор на рабочие некодинговые задачи, апгрейднули способности в Excel, выкатили интеграцию с PowerPoint. Логичное продолжение темы с Claude Cowork.
- Сильно улучшили работу с контекстом — теперь модель будет эффективнее сжимать контекст и лучше находить в нем информацию, что в купе с большим контекстным окном должно дать крутой эффект.
- Добавили «команды агентов» — можно запускать параллельно несколько агентов, у каждого из которых своя сессия, а значит независимый «мыслительный процесс». А еще эти агенты будут между собой переписываться и делить задачи, а не дублировать друг друга.
Похоже Claude Opus 4.6 — новый царь горы! 🤴
- Час назад выкатили новый GPT-5.3-Codex.
Как всегда — быстрее (на 25%), выше (по всем агентном бенчмаркам по версии OpenAI), сильнее (думает и коллаборирует с разработчиком). OpenAI заявляют новую модель как лучшую на текущий момент для кодинга и агентных задач.
Из интересного:
- Тоже большой акцент сделали на использование Codex для некодинговых задач. Мол презентацию сделает, PRD напишет, табличку составит. Видимо, ответка на Claude Cowork.
- А ещё бьют себя в грудь, что это самая заточенная под задачи в области кибербеза. Модель специально учили искать уязвимости в ПО.
А ещё маркетинговая фишка — ранние версии 5.3-Codex использовали в процессе разработки более поздних версий самой себя. Вот такая вот рекурсия…
Похоже GPT-5.3-Codex — новый царь горы! 🤴
А, я это уже говорил?
В общем, по версии Клода — лучшая агентная модель у них, по версии OpenAI — у них. Ну и конечно с таким таймингом релиза мы пока не знаем, кто в итоге новый лидер по бенчмаркам AI для кодинга и агентных задач 😄
А может в этом и был план?! Не нужно спешить с разработкой новой модели, оба релизнулись, оба молодцы, никто не проиграл, никто не выиграл. Перед инвесторами все отчитались. Разработчики отпуск возьмут наконец-то 🤓
- И как вишенка на торте — три часа назад Perplexity представил Model Council.
Фича дает возможность запускать параллельно 3 модели на выбор. Потом результаты сравниваются моделью-композером, и сравнительный анализ и саммари возвращается юзеру.
Похоже, что в новом Claude Opus можно реализовать такую же штуку. Но Perplexity мы любим за разнообразие моделей — поэтому на мой взгляд, фича все равно круче, чем просто прогон команды из трех агентов Claude.
Отличный способ перепроверки для снижения количества галлюцинаций.
Подписывайтесь на Telegram Заместители.