Claude Opus 4.8 вышел. И самое интересное — не бенчмарки.
Anthropic обновила Opus: модель стала сильнее в кодинге, reasoning и агентских задачах, цена осталась прежней — $5 / $25 за миллион токенов.
Но главный апдейт - в поведении:
One of the most prominent improvements in Opus 4.8 is its honesty
Opus 4.8, по словам Anthropic, чаще признаёт неопределённость, лучше ловит собственные ошибки и примерно в 4 раза реже пропускает баги в написанном коде без замечаний.
Плюс в Claude Code появился dynamic workflows: Claude может разбивать большую задачу на десятки/сотни параллельных subagents и тащить большие миграции, аудиты и рефакторинги.
Кажется, AI-гонка постепенно смещается от слепой гонки за бенчмарками к более ощутимым и близким любому человеку метрикам. К примеру: "наша модель модель меньше врёт", "лучше проверяет себя", "может дольше работать без человека".
И вот это уже гораздо интереснее очередного плюсика в бенче.
Конечно же не забыли напомнить и про Mythos:
we expect to be able to bring Mythos-class models to all our customers in the coming weeks.
Хочется верить, что в ближайший месяц-полтора уже выпустят модель для всех.
Подписывайтесь на телеграм канал Кисель в Айти. Там ещё больше интересного.