Claude Opus 4.5 достиг 80% на SWE-bench Verified

Claude Opus 4.5 достиг 80% на SWE-bench Verified

Claude Opus 4.5 таки смог взять 80% на SWE-bench Verified!

Бонусом в модель добавили effort control — прямо как у OpenAI: high, medium, low, дольше думает = лучше решает.

На бенчмарках... ВНЕЗАПНО ждём, потому что цена упала до $5/$25 за миллион токенов (в 3 раза).

Подписывайтесь на Telegram Denis Sexy IT 🤖.

Начать дискуссию