Anthropic запускает плагин Claude для Chrome с новыми мерами безопасности

Anthropic запускает пилот плагина Claude для Chrome. Теперь он будет “видеть” всё, что вы просматриваете в браузере: любые страницы, кнопки, формы, письма.

Он может автоматически управлять календарём, составлять черновики писем, помогать с отчётами по расходам и даже тестировать функции сайтов.

Однако вместе с удобством появляется и угроза. ИИ-агенты в браузере уязвимы перед так называемыми prompt injection - атаками.

Злоумышленники могут спрятать инструкции прямо в код сайта или письма, и агент воспринимает их как команду. В тестах Anthropic без дополнительных защит такие атаки проходили успешно в 23,6% случаев.

После внедрения новых мер безопасности получилось снизить показатель до 11,2%. А для особого набора атак, связанных исключительно с браузером (скрытые поля в DOM или инструкции в URL), компания сумела обнулить риск - с 35,7% до 0%. Но тем не менее 11% всё равно пугают.

Что сделано для безопасности Claude for Chrome:

• Гибкий контроль доступа: пользователь решает, какие сайты доступны ИИ

• Подтверждения на действия повышенного риска - публикации, платежи, передача личных данных

• Блокировка категорий с высокой опасностью: финансы, adult, пиратский контент

• Улучшенные системные подсказки, которые обучают ИИ осторожнее работать с данными

• Классификаторы для поиска подозрительных шаблонов в инструкциях и запросах

• Даже в автономном режиме Claude не тронет особо чувствительные операции без вашего согласия

Anthropic также подчёркивает психологическую сторону доверия: у пользователя должна быть привычка проверять, что именно делает ИИ. Это как работа с ассистентом - со временем вы делегируете больше, но контроль за критичными процессами всегда остаётся за вами.

Кто хочет попробовать - Anthropic открыл waitlist.

Подписывайтесь на Telegram Сергей Булаев AI 🤖.