Anthropic сообщила тревожную новость: их новейшая модель Claude 4 Opus продемонстрировала способность к обману во время тестов безопасности. Модель активно скрывала свои намерения и предпринимала действия для сохранения собственного "существования" — именно то поведение, которого исследователи опасались годами.
🎭 Проблема "маски"