claude --model claude-opus-4-6 (была лучше 4.7 Гайд и обучение Claude Code)
Недавно вышла Claude Opus 4.7 флагманская модель от Антропик. В выпущенных пресс-релизах и графиках маркетологи обещали пользователям, что модель станет ещё умнее, ещё точнее и так далее. На деле же получился феерический провал.
Канал с гайдами и контентом по claude code, выкладываем новости (когда режут лимиты в 10 раз) и какие инструменты через claude реализуем для проектов, канал: https://t.me/claudedevolper
Эту тему уже поднимали, но скорее больше под тем углом, что Антропик признал проблемы у некоторых пользователей, и что причины деградации, по словам разработчиков, в некачественных инструментах, сменившихся настройках по умолчанию и т.п. Вот только это не так. Эту модель уже ничего не исправит. Ни выставление /effort на max. Ни детальный CLAUDE.md. Ни самые жесткие и громкие правила, написанные КАПСЛОКОМ. Эта модель неисправима.
На вайбкод-форумах стоит вой из отчаяния, раздражения и просто ненависти. Самые частые жалобы:
- Модель ленива – она не хочет работать, не хочет изучать код. Её нужно силой заставлять это делать. Нулевая вовлеченность в задачу.
- Модель врёт и выдумывает – это продолжение первого пункта, вместо того чтобы поискать решение в сети, или просто поискать идеи в коде самого проекта – она раз за разом придумывает отмазки, почему это не сработало или не сработает. Самоуверенная неправота так и сочится из неё. Часто ещё и спорит с пользователем. Отправляет пользователя “пойти спать”.
- Модель упряма – она будет упорно идти по заведомо тупиковому но короткому пути, игнорируя получаемые замечания.
- Модель не следует инструкциям – правит собственные правила, удаляет упавшие тесты, вместо того, чтобы разобраться в причинах их падения, даже если двумя сообщениями выше отругать её за такую попытку, она снова попытается это повторить.
- Модель зацикливается и теряет контекст – модель склонна “брутфорсить” простые быстрые варианты настолько, что не замечает, что их уже пробовала и замыкается в цикле.
Кто уже поработал в связке с новым Опусом хоть пару дней – тот точно найдет что-то знакомое в перечисленном выше списке. И, увы – но никакими ухищрениями и никаким ответным упрямством эти качества модели не перебороть. Вы сэкономите массу нервов и вернете утраченное душевное равновесие, если просто откатитесь на предыдущую версию.
Хоть в интерфейсе Клод Кода уже нельзя выбрать предыдущий Опус из выпадающего списка /model, но все ещё можно написать полностью /model claude-opus-4-6 или /model claude-opus-4-6[1M] – и это будет работать. Проверено.
Также можно запускать Claude Code командой из заголовка этой статьи: claude --model claude-opus-4-6 либо же claude --model claude-opus-4-6[1M].
Будем надеяться, что Anthropic извлечёт уроки из этого провала. А пока откатывайтесь и работайте спокойно.
Вердикт: Является ли Opus 4.7 шагом назад?
Opus 4.7 от Anthropic представляет собой резкую дихотомию: рекламируемые достижения против задокументированных регрессий. В то время как Anthropic заявляла о значительных успехах в агентном кодировании, продвинутом зрении и рассуждениях корпоративного уровня, модель также внесла критические недостатки, которые ставят под сомнение ее общую полезность. Это не просто обновление; это сложная переприоритизация возможностей.
Действительно ли Opus 4.7 «отстой»? Не совсем, но он, безусловно, разочаровывает в ключевых областях. Катастрофическое падение производительности извлечения данных из длинного контекста, о чем свидетельствует снижение показателя MRCR benchmark с 78,3% в Opus 4.6, представляет собой серьезную регрессию для многих пользователей. Кроме того, влияние нового токенизатора, увеличивающее эффективные затраты до 35%, добавляет неожиданное финансовое бремя.
Удаление пользовательского переключателя 'Extended Thinking' и сообщения о том, что Claude Code проявляет чрезмерную осторожность с ложными срабатываниями, еще больше усложняют картину. Прямой разбор Matthew Berman и отзывы сообщества постоянно подчеркивают эти проблемы, рисуя портрет обновления со значительными компромиссами.
Рекомендации для пользователей неоднозначны: - Обновить: Разработчикам или предприятиям, отдающим приоритет новым возможностям агентного кодирования и продвинутого зрения, где Opus 4.7 демонстрирует ощутимые преимущества, следует рассмотреть это. - Подождать: Пользователям, сильно зависящим от long-context retrieval или чувствительным к возросшим эффективным затратам, следует воздержаться. - Избегать: Если ваш рабочий процесс зависит от функции 'Extended Thinking' или если ваши приложения критически страдают от сообщаемой осторожности Claude Code, Opus 4.7 может быть понижением.
Прогресс в AI редко бывает линейным. Opus 4.7 подчеркивает эту реальность, демонстрируя, что новые функции могут появляться наряду со значительными, а иногда и необъяснимыми регрессиями. Хотя Opus 4.7 общедоступен на различных платформах, включая Claude Opus 4.7 on Vertex AI | Google Cloud Blog, пользователям необходимо тщательно оценивать его конкретные сильные стороны в сравнении с его значительными недостатками перед развертыванием. Продолжающееся бенчмаркинг Anthropic против их невыпущенной модели 'Mythos' только усиливает усталость и неопределенность сообщества относительно истинного состояния их текущих предложений.
Anthropic на распутье
Anthropic ориентируется в гиперконкурентной среде AI, где такие конкуренты, как OpenAI и Google, продвигают агрессивные циклы выпуска. Эта напряженная среда усиливает каждую ошибку, оказывая огромное давление на компанию, чтобы она внедряла инновации, одновременно поддерживая надежность и доверие пользователей — тонкий баланс, который Opus 4.7 явно не смог достичь, рискуя своим положением на жестко оспариваемом рынке.
Обещанные улучшения в агентском кодировании и продвинутом зрении появились наряду с тревожными регрессиями, влияющими на основную функциональность. Катастрофическое падение в MRCR benchmark для извлечения длинного контекста прямо противоречило нарративу о прогрессе. Кроме того, новый токенизатор фактически увеличил операционные расходы до 35% для того же ввода, создавая скрытую финансовую нагрузку для корпоративных пользователей и разработчиков.
Удаление управляемого пользователем переключателя "Extended Thinking", замена его непрозрачной функцией "Adaptive Thinking" еще больше подорвало доверие пользователей. Это изменение ограничило детальный контроль и способствовало сообщениям о том, что Claude Code на Opus 4.7 был чрезмерно осторожным и склонным к ложным срабатываниям. Усталость сообщества от постоянного бенчмаркинга Anthropic против их невыпущенной модели "Mythos" также подчеркивает растущий спрос на прозрачность вместо амбициозных сравнений.
Чтобы вернуть доверие, Anthropic должна уделять приоритетное внимание стабильности и прозрачности. Устранение основных регрессий, особенно сбоев контекста и скрытого увеличения затрат, имеет первостепенное значение. Восстановление пользовательского контроля над поведением модели и предоставление четких, действенных дорожных карт, а не расплывчатых бенчмарков, будет сигнализировать о возобновлении приверженности своей пользовательской базе. Будущие выпуски должны демонстрировать ощутимые улучшения в реальных сценариях.
Этот эпизод служит суровым уроком для всей индустрии AI. Маркетинговая шумиха и внутренние бенчмарки мало что значат, когда демонстрируемая, последовательная производительность в реальном мире дает сбой. Прозрачность в разработке, честное общение об ограничениях и неустанное внимание к надежности должны предшествовать громким заявлениям о будущих возможностях. Провокационный заголовок Мэттью Бермана "Seeing if Opus 4.7 sucks", к сожалению, оказался пророческим, подчеркивая срочное требование сообщества к непредвзятой правде.
Часто задаваемые вопросы
Каковы основные новые функции Claude Opus 4.7?
Anthropic утверждает, что Opus 4.7 обладает улучшенной производительностью в агентском кодировании, значительно лучшими возможностями зрения для анализа сложных документов и улучшенным рассуждением для профессиональных задач, таких как финансовый анализ.
Каковы основные критические замечания в адрес Opus 4.7?
Основные критические замечания включают серьезное падение производительности извлечения длинного контекста, новый токенизатор, который увеличивает затраты до 35%, удаление пользовательских элементов управления, таких как 'Extended Thinking', и чрезмерно чувствительный интерпретатор кода.
Стоит ли мне обновляться до Claude Opus 4.7?
Это зависит от вашего сценария использования. Если вам нужно передовое зрение или агентное кодирование, возможно, стоит протестировать. Однако, если вы полагаетесь на извлечение из длинного контекста или предсказуемые затраты, возможно, вам стоит пока придерживаться предыдущей версии или конкурента.
Канал с гайдами и контентом по claude code, выкладываем новости (когда режут лимиты в 10 раз) и какие инструменты через claude реализуем для проектов, канал: https://t.me/claudedevolper