Claude Opus 4.8 вышел. И самое интересное — не бенчмарки.

Anthropic обновила Opus: модель стала сильнее в кодинге, reasoning и агентских задачах, цена осталась прежней — $5 / $25 за миллион токенов.

Но главный апдейт - в поведении:

One of the most prominent improvements in Opus 4.8 is its honesty

Opus 4.8, по словам Anthropic, чаще признаёт неопределённость, лучше ловит собственные ошибки и примерно в 4 раза реже пропускает баги в написанном коде без замечаний.

Плюс в Claude Code появился dynamic workflows: Claude может разбивать большую задачу на десятки/сотни параллельных subagents и тащить большие миграции, аудиты и рефакторинги.

Кажется, AI-гонка постепенно смещается от слепой гонки за бенчмарками к более ощутимым и близким любому человеку метрикам. К примеру: "наша модель модель меньше врёт", "лучше проверяет себя", "может дольше работать без человека".

И вот это уже гораздо интереснее очередного плюсика в бенче.

Конечно же не забыли напомнить и про Mythos:

we expect to be able to bring Mythos-class models to all our customers in the coming weeks.

Хочется верить, что в ближайший месяц-полтора уже выпустят модель для всех.

Подписывайтесь на телеграм канал Кисель в Айти. Там ещё больше интересного.