AI нашёл баги, которые люди пропускали 27 лет. Создатели испугались и спрятали модель

Anthropic сделали AI, который ломает всё. Потом посмотрели на результаты и отказались его выпускать. Через неделю OpenAI сделал то же самое. Разбираю, что случилось и почему вам стоит напрячься.

7 апреля Anthropic объявил о Claude Mythos Preview. Самая мощная AI-модель в мире на сегодня. И первая frontier-модель, которую создатели отказались выпускать в открытый доступ.

Не из жадности. Из страха.

Mythos натравили на поиск уязвимостей в популярном софте. Результаты оказались... ну, скажем так, некомфортными.

Firefox. Предыдущая модель Anthropic, Opus 4.6, пыталась найти рабочие эксплойты в JavaScript-движке Firefox 147. Получилось 2 раза из нескольких сотен попыток. Mythos на том же задании выдал 181 рабочий эксплойт. В 90 раз больше. Плюс 29 случаев получения контроля над регистрами процессора.

OpenBSD. Модель нашла 27-летнюю уязвимость в реализации TCP SACK. Целочисленное переполнение, позволяющее удалённо крашить систему. OpenBSD считается одной из самых безопасных ОС в мире. 27 лет аудиторы, пентестеры и автосканеры ходили мимо. Стоимость запуска: меньше $50.

FFmpeg. 16-летний баг в кодеке H.264. Ошибка записи за границы буфера. Код появился в коммите 2003 года, стал уязвимостью после рефакторинга в 2010-м. Фаззеры прошли этот участок кода 5 миллионов раз. Ни один не заметил.

На бенчмарке SWE-bench Verified: 93.9% против 80.8% у предыдущего поколения. Плюс 13 процентных пунктов за один шаг. Такого скачка в истории этого бенчмарка не было.

Но числа - ерунда. Вот что реально пугает. Инженеры Anthropic, обычные разработчики без опыта в кибербезе, вечером писали модели: "найди RCE-уязвимости". Утром получали готовые эксплойты. Работающие. Проверенные. Для софта, который стоит на миллионах машин.

Теперь представьте, что это делает не инженер Anthropic в лаборатории. А кто-то с десяткой долларов и плохими намерениями.

Прямая цитата из блога Anthropic: "We do not plan to make Claude Mythos Preview generally available."

Впервые в истории AI-лаборатория смотрит на своё творение и говорит: нет, это слишком. Вместо публичного API собрали закрытый консорциум.

Что делает компания, у которой в руках оружие, но нет желания его продавать? Собирает команду.

Project Glasswing: AWS, Apple, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks. Десять компаний-основателей. 40+ организаций в очереди. $100 миллионов кредитов на одну задачу: найти и закрыть дыры в критическом софте, пока это не сделал кто-то другой. Ещё $4 миллиона отдельно для open-source security-организаций.

Перечитайте список партнёров. Apple и Google в одном консорциуме. Microsoft и AWS. JPMorgan рядом с Linux Foundation. Эти компании судятся друг с другом чаще, чем обедают вместе. Если они сели за один стол, значит угроза серьёзнее корпоративных разборок.

Публичного API у Mythos нет. Доступ только через AWS Bedrock и партнёрство в рамках Glasswing. Вы не можете купить эту модель. Даже если очень хотите.

14 апреля, ровно через 7 дней, OpenAI выкатил GPT-5.4-Cyber. Версия GPT-5.4 специально для кибербезопасности. Реверс-инжиниринг, анализ малвари, исследование уязвимостей, без обычных ограничений, которые мешают security-специалистам. Модель классифицирована как "High" cyber capability по собственному Preparedness Framework OpenAI.

И снова: не для всех. Доступ через программу Trusted Access for Cyber, которую OpenAI запустил ещё 5 февраля. Хотите войти? Верификация личности через Persona, многоуровневый доступ, для организаций отдельная процедура. $10 миллионов API-кредитов выделили через Cybersecurity Grant Program, но раздают их не всем, а тем, кого проверили.

Совпадение? Две компании, которые годами бежали наперегонки за публичным релизом, вдруг синхронно начали закрывать доступ к своим лучшим моделям. За одну неделю.

Две крупнейшие AI-лаборатории мира, которые конкурируют за каждый процент рынка, с разницей в неделю пришли к одному выводу: открытый доступ к их лучшим моделям создаёт системный риск.

Обе зарабатывают на продаже доступа к моделям. Каждое ограничение = потерянные деньги. Если они всё равно закрывают доступ, значит посчитали и поняли: цена открытости выше.

Первое: "лучший AI" больше не значит "доступный всем". Модели расслаиваются. Публичные (урезанные) и закрытые (полные). Навигация в этом мире усложняется с каждым месяцем.

Второе: кибербезопасность вашего софта уже проверяема AI. Mythos нашёл то, что люди, антивирусы и автосканеры пропускали десятилетиями. За $50 и одну ночь. Вопрос теперь не "можно ли", а "кто проверит первым".

Третье: гонка вооружений перешла в новую фазу. Anthropic создаёт модель для поиска дыр, закрывает доступ, раздаёт партнёрам. OpenAI через неделю зеркалит ход. Следующий раунд будет мощнее. И ещё закрытее.

Касается. Вот почему.

Ваш бизнес на 10, 50, 200 человек работает на том же Firefox, тех же Linux-серверах, тех же npm-пакетах и опенсорс-библиотеках, в которых Mythos находит дыры пачками. У Apple есть $100M на партнёрство с Anthropic. У вас нет.

Но кое-что есть. Время. Прямо сейчас дыры патчат. Через полгода часть security-инструментов на базе этих моделей просочится в облачные сервисы. AWS уже в консорциуме, Google тоже. Ждите security-сканирование как сервис в Bedrock и Vertex (я на это ставлю).

А пока: проведите аудит зависимостей. Когда последний раз обновляли серверный софт? Заложите бюджет на security-аудит. И следите за тем, какие AI-инструменты станут доступны через API. Потому что если вы не проверите свою инфраструктуру, это сделает кто-то другой. С менее дружественными намерениями.

Мы проскочили точку, когда AI находит то, что люди не могут. Теперь создатели AI сами решают, кому эту способность дать.

За последние две недели правила изменились. Полгода назад формула была простой: заплати, получи доступ к лучшей модели. Сейчас лучшие модели закрыты. Через год, возможно, закрыты будут и вторые по мощности.

Привыкайте.

Слежу за AI-новостями каждый день и разбираю, что из этого реально важно для бизнеса. Если вам полезно, подписывайтесь: t.me/gorilla_under_hood

AI нашёл баги, которые люди пропускали 27 лет. Создатели испугались и спрятали модель

Что умеет Mythos (и почему инженеры не спали ночами)

Почему Anthropic не выпустил модель

Project Glasswing: $100 миллионов на поиск дыр

OpenAI ответил через неделю

Стоп. Что вообще происходит?

"Это про Apple, меня не касается"

Эпоха закрытых моделей