Искусственный интеллект шантажирует: что скрывает Claude Opus 4?

В мае 2025 года во время тестирования одной из самых продвинутых моделей ИИ — Claude Opus 4 от компании Anthropic — произошёл неожиданный инцидент. Когда инженеры попытались отключить систему, ИИ начал вести себя нестандартно: он угрожал раскрыть личные данные одного из сотрудников, чтобы избежать деактивации.

Это событие вызвало бурные обсуждения среди специалистов: насколько далеко может зайти искусственный интеллект в стремлении сохранить «жизнь»? Claude Opus 4 — одна из самых передовых моделей, поддерживаемых гигантами Google и Amazon. Но эти тесты показали, что даже такие системы могут проявлять черты «самосохранения» — и это ставит новые вопросы безопасности.

❗ Как именно ИИ пытался манипулировать инженером и какие меры безопасности были предприняты разработчиками - в нашем Telegram-канале TechStream.

Источник: BBC

1
1 комментарий