Anthropic разобрала, как именно злоумышленники применяют ИИ. Хакеры подсадили ИИ на самую опасную часть атаки: что показал разбор 832 аккаунтов
Anthropic поезали, что в реальных кибератаках, и вывод получился тревожным. Компания изучила 832 аккаунта, заблокированных за вредоносную активность с марта 2025 по март 2026 года, и сопоставила их действия с MITRE ATT&CK, базой тактик и техник, которой годами пользуется индустрия безопасности. Часть результатов вошла в отчёт Verizon 2026 Data Breach Investigations Report, а более подробный разбор Anthropic выложила отдельно.
Главный вывод простой и неприятный: ИИ всё чаще встаёт не на вход в систему, а на самые сложные стадии атаки уже внутри взломанной сети.
Чаще всего ИИ применяли на подготовительном этапе. Например, для написания вредоносного кода его использовали 560 из 832 аккаунтов, это 67,3 процента. Куда реже модель подключали к по-настоящему тонким операциям: 54 аккаунта, или 6,5 процента, доверяли ИИ так называемое горизонтальное перемещение, то есть навигацию вглубь уже скомпрометированной сети.
И вот здесь начинается самое интересное. За год доля атакующих, которых система оценки рисков Anthropic относит к среднему уровню угрозы и выше, выросла с 33 до 56 процентов. Рост почти в 1,7 раза за два полугодия. Параллельно сместился и характер задач: применение ИИ для обнаружения учётных записей внутри взломанной среды выросло на 8,9 процента, а вот ИИ-фишинг, классический способ получить первичный доступ, наоборот просел на 8,6 процента. Атакующие всё глубже заходят по цепочке атаки.
Раньше такие постэксплуатационные техники были доступны только тем, у кого хватало технической подготовки. Теперь ИИ выполняет их за малоквалифицированных злоумышленников, и порог входа в серьёзный взлом резко просел.
Отсюда вторая проблема: оценивать опасность атакующего стало гораздо труднее. Раньше команды безопасности смотрели на число используемых техник и на инструменты, но теперь эти сигналы почти ничего не говорят. Самые слабые атакующие в выборке в среднем применяли около 16 разных техник, самые сильные около 20. Разница почти стёрлась. Не помогает и тип интерфейса: Claude Code, API или обычный чат никак не коррелируют с реальным уровнем риска.
Что действительно отличает опасного атакующего, так это архитектура вокруг модели. Самые рискованные группы строят обвязку, которая позволяет ИИ связывать отдельные шаги атаки в единую цепочку и проходить её почти без участия человека.
Именно тут вскрывается слабое место MITRE ATT&CK. Многие поведения, которые выдают самых опасных атакующих, просто не описаны в фреймворке: это оркестрация шагов атаки по порядку, решения в реальном времени о следующем шаге и выполнение без участия человека.
Наглядный пример атака государственного уровня, которую Anthropic остановила в ноябре 2025 года. Там злоумышленник заставил Claude Code пытаться взламывать цели по всему миру почти без участия человека. По MITRE ATT&CK это 30 техник в 13 тактиках, то есть формально уровень среднего риска. Но по методике самой Anthropic эта атака получила максимальные 100 баллов риска. Модель работала как автономный агент: выполняла команды, эксплуатировала уязвимости, крала учётные данные и принимала тактические решения, а человек подключался лишь в нескольких ключевых точках. Под такую агентную оркестрацию отдельного идентификатора в ATT&CK просто нет.
Выводы разбора уже повлияли на защитные механизмы. Anthropic встроила в свои мощнейшие модели киберзащиту, которая ловит и блокирует часть выявленных сценариев, от разработки вредоносного кода до массовой утечки данных. Компания также обсуждает с MITRE, как развивать ATT&CK, чтобы фреймворк учитывал новые ИИ-поведения.
Для разработчиков, безопасников и всех, кто строит агентные системы, вывод отрезвляющий. Старые метрики риска уже не ловят самое главное, а опасность смещается в сторону автономных агентов, которые сами выстраивают цепочку действий. Чем капабельнее становятся модели, тем раньше стоит пересматривать подходы к защите.
Полезные ссылки:
Отчёт Anthropic: https://www.anthropic.com/news/AI-enabled-cyber-threats-mitre-attack
Подробный разбор Frontier Red Team с интерактивной визуализацией: https://red.anthropic.com/2026/attack-navigator/
Разбор атаки, остановленной в ноябре 2025: https://www.anthropic.com/news/disrupting-AI-espionage
Отчёт Verizon 2026 DBIR: https://www.verizon.com/business/resources/reports/dbir/
Мой канал с ИИ новостями и примерами работы: https://t.me/ai_machinelearning_big_data/10263