Anthropic представила модель Claude Sonnet 4.5 — она может работать автономно в течение 30 часов подряд

А в сервис для программирования Claude Code добавили функцию «контрольных точек», которая позволяет сохранять прогресс задачи и возвращаться к нему.

Результаты тестов по программированию. Источник: Anthropic
Результаты тестов по программированию. Источник: Anthropic
  • Об обновлениях Anthropic рассказала в блоге. Компания называет Claude Sonnet 4.5 «самой мощной моделью» для программирования и создания ИИ-агентов. Она также «демонстрирует значительный прогресс» в рассуждениях и математике.
  • Claude Sonnet 4.5 способна работать автономно в течение 30 часов подряд. По словам Anthropic, в ходе тестов модель написала около 11 тысяч строк кода для создания приложения, «похожего на Slack», и остановилась только после завершения задачи.

  • Новая модель «особенно эффективна» в сферах кибербезопасности, финансов и исследований, утверждает компания. Бета-тестировщики, в число которых входят Cursor, GitHub, Canva, Netflix и другие, отмечают, что Sonnet 4.5 лучше справляется с редактированием кода, поиском уязвимостей, продуктовыми исследованиями и другими задачами с «длинным контекстом».

  • Агенты на базе Claude Sonnet 4.5 «более чем в три раза лучше» справляются с навигацией в браузере и использованием компьютера от имени пользователя, заявила The Verge руководитель отдела управления продуктами в Anthropic Дайан Пенн.
  • Модель может работать «на уровне руководителя» — например, сверять календари нескольких сотрудников и назначать встречи, а также собирать аналитику и обновлять информацию о задачах по итогам совещаний с подчинёнными, добавил глава продукта Claude.ai Скотт Уайт.
  • Помимо этого, Anthropic обновила Claude Code. Теперь он по умолчанию использует Sonnet 4.5. В сервисе появилась функция «контрольных точек» — она позволяет сохранять прогресс задачи и возвращаться к нему, отменяя изменения в коде.
40
5
56 комментариев