Как растут сервисы по генерации фейковых инструментов — и чем это может вам аукнуться

Если ты можешь сгенерировать фейковый паспорт, значит, кто-то может сгенерировать твой

6
2

Anthropic усилила защиту Claude: как AI-компания строит многоуровневую систему безопасности

Anthropic усилила защиту Claude: как AI-компания строит многоуровневую систему безопасности

Компания Anthropic, разработчик искусственного интеллекта Claude, представила подробности своей стратегии по защите ИИ от вредоносного использования. Этот подход уже внедрён в работу и для некоторых моделей стал ещё строже — например, Claude Opus 4 получил повышенный уровень безопасности ASL-3.

Праздник непослушания: ИИ модели могут лишь притворяться, что слушают инструкции

Исследователи выяснили, что ИИ модели могут только на словах соглашаться следовать инструкциям, преследуют свои собственные цели (да-да, все как у людей!). Почему исследователи сделали такой вывод, чем это грозит, и как собираются исправлять?

🔥 Еще больше интересного в моем канале Продуктовые штучки

2
1

Большинство ИИ-моделей склонны к шантажу в определённых условиях

И это не баг, а фича, утверждают исследователи. Расскажу, как пришли к такому выводу пришли, и что предлагается делать

🔥 Еще больше интересного в моем канале продуктовые штучки

2

Anthropic выпустил бесплатный онлайн-курс «Грамотность в работе с ИИ»

🔥 Еще больше интересного в моем канале продуктовые штучки

Курс AI Fluency рассчитан на 3–4 часа, состоит из 12 модулей и предназначен для широкой аудитории — как для новичко…