Anthropic запускает плагин Claude для Chrome с новыми мерами безопасности
Anthropic запускает пилот плагина Claude для Chrome. Теперь он будет “видеть” всё, что вы просматриваете в браузере: любые страницы, кнопки, формы, письма.
Он может автоматически управлять календарём, составлять черновики писем, помогать с отчётами по расходам и даже тестировать функции сайтов.
Однако вместе с удобством появляется и угроза. ИИ-агенты в браузере уязвимы перед так называемыми prompt injection - атаками.
Злоумышленники могут спрятать инструкции прямо в код сайта или письма, и агент воспринимает их как команду. В тестах Anthropic без дополнительных защит такие атаки проходили успешно в 23,6% случаев.
После внедрения новых мер безопасности получилось снизить показатель до 11,2%. А для особого набора атак, связанных исключительно с браузером (скрытые поля в DOM или инструкции в URL), компания сумела обнулить риск - с 35,7% до 0%. Но тем не менее 11% всё равно пугают.
Что сделано для безопасности Claude for Chrome:
• Гибкий контроль доступа: пользователь решает, какие сайты доступны ИИ
• Подтверждения на действия повышенного риска - публикации, платежи, передача личных данных
• Блокировка категорий с высокой опасностью: финансы, adult, пиратский контент
• Улучшенные системные подсказки, которые обучают ИИ осторожнее работать с данными
• Классификаторы для поиска подозрительных шаблонов в инструкциях и запросах
• Даже в автономном режиме Claude не тронет особо чувствительные операции без вашего согласия
Anthropic также подчёркивает психологическую сторону доверия: у пользователя должна быть привычка проверять, что именно делает ИИ. Это как работа с ассистентом - со временем вы делегируете больше, но контроль за критичными процессами всегда остаётся за вами.
Кто хочет попробовать - Anthropic открыл waitlist.
Подписывайтесь на Telegram Сергей Булаев AI 🤖.