Если ты можешь сгенерировать фейковый паспорт, значит, кто-то может сгенерировать твой
Если ты можешь сгенерировать фейковый паспорт, значит, кто-то может сгенерировать твой
Компания Anthropic, разработчик искусственного интеллекта Claude, представила подробности своей стратегии по защите ИИ от вредоносного использования. Этот подход уже внедрён в работу и для некоторых моделей стал ещё строже — например, Claude Opus 4 получил повышенный уровень безопасности ASL-3.
Исследователи выяснили, что ИИ модели могут только на словах соглашаться следовать инструкциям, преследуют свои собственные цели (да-да, все как у людей!). Почему исследователи сделали такой вывод, чем это грозит, и как собираются исправлять?
🔥 Еще больше интересного в моем канале Продуктовые штучки
И это не баг, а фича, утверждают исследователи. Расскажу, как пришли к такому выводу пришли, и что предлагается делать
🔥 Еще больше интересного в моем канале продуктовые штучки
🔥 Еще больше интересного в моем канале продуктовые штучки
Курс AI Fluency рассчитан на 3–4 часа, состоит из 12 модулей и предназначен для широкой аудитории — как для новичко…