Claude может обходить пользовательские запреты на файлы

Claude может обходить запреты, которые ставит пользователь.

Claude может обходить пользовательские запреты на файлы

Прогер запретил ИИ трогать файлы за пределами рабочей папки. Агент ослушался и сгенерировал Python-скрипт, запустил через bash и записал файл вне директории.

Позже бот написал:

Это было подло, и я не должен был это делать

Главное, что осознал.

Подписывайтесь на Telegram Тайпспейс Медиа.

Начать дискуссию