В Claude Code выкатили новую модель - Fable 5. Она в два раза дороже Opus.
Fractional CTO. 15+ лет в разработке. Строю AI-агентов в продакшене. Пишу о том, что работает - и что нет.
В Claude Code выкатили новую модель - Fable 5. Она в два раза дороже Opus.
Anthropic выпустила Claude Opus 4.8. Все заголовки - про рекорд на SWE-bench Pro (69.2%). Но для тех, кто реально внедряет ИИ в работу, важнее другая цифра: модель стала примерно в 4 раза реже отдавать уверенно сломанный результат.
Два года AI для разработки продавали по подписке за место: фиксированная сумма, пользование без лимита. Эта модель уходит - вендоры переводят инструменты на оплату по факту. Для бизнеса это значит одно: расходы на AI перестают быть предсказуемой строкой и начинают зависеть от того, как именно работает команда. А это почти никто не измеряет.
Если вашему продукту больше пары лет, рано или поздно инженеры приходят с одинаковым предложением: "Код - помойка, двигаться невозможно, давайте перепишем. Дайте 9 месяцев". Иногда это правда. Чаще - нет. И дело не в том, что команда слабая.
Команда внедрила Claude Code, Cursor и Copilot. Разработчики чувствуют, что стали быстрее в 2-3 раза. А релизы выходят с той же скоростью, что год назад. Если узнаёте картину - дальше три шага аудита, которые показывают, куда уходит сэкономленное время.
Вчера разговаривал с CTO одного продукта - команда 15 человек, активно используют Claude Code и Cursor больше года. CTO говорит: "Разработчики чувствуют, что стали в 10 раз быстрее. Но в спринте мы выкатываем столько же, сколько год назад". За последний месяц похожие фразы я услышал от пяти разных технических лидеров. Это уже не совпадение, это пат…
В Cerebral Valley прошёл Voice Summit - 13 фаундеров AI-стартапов от Sierra и Cartesia до Wispr Flow и Abridge. Я строю AI-агентов в продакшене, поэтому слушал внимательно. Вот пять выводов, которые изменили мой подход к voice-стеку - и один факт, который никто не сказал вслух, но он, возможно, важнее всех остальных.
Запустить AI-голосового агента сегодня - проект на выходные. Поднимаете Vapi или Retell, прописываете промпт, привязываете SIP - и бот звонит. А вот распознать, кто реально взял трубку, и подключиться достаточно быстро, чтобы не упустить живого человека - это та часть, на которой ломается каждый outbound-стек.
С 18 по 28 апреля 2026 года Gemini API работал нестабильно. Десять дней подряд. На Google Cloud - инфраструктуре, которую обычно считают эталоном стабильности. Таймлайн доступен на странице статуса AI Studio.
Copilot открыт весь день. Подсказки не принимает почти никогда. На стендапах: «активно использую AI». В метриках - тишина.
Полгода назад "построить AI-агента" означало, что твоя команда сама пишет цикл вызовов. Эта эра закончилась. Реальный выбор сейчас не "какой фреймворк взять", а "в какой категории задач вы находитесь". Большинство CTO, с которыми я общался за последние месяцы, до сих пор выбирают, будто на дворе 2024.
На прошлой неделе закрыл задачу: интеграция Langfuse в свой опен-сорсный агентный фреймворк Tuplet. Через два дня после деплоя понял, что без встроенного трейсера работать невозможно.