Aiэтика: статьи и новости по теме

Томатная паста

29 окт

Как растут сервисы по генерации фейковых инструментов — и чем это может вам аукнуться

Если ты можешь сгенерировать фейковый паспорт, значит, кто-то может сгенерировать твой

Новости ИИ простыми словами

13 авг

Anthropic усилила защиту Claude: как AI-компания строит многоуровневую систему безопасности

Компания Anthropic, разработчик искусственного интеллекта Claude, представила подробности своей стратегии по защите ИИ от вредоносного использования. Этот подход уже внедрён в работу и для некоторых моделей стал ещё строже — например, Claude Opus 4 получил повышенный уровень безопасности ASL-3.

Наташа Хазеева

13 июля

Праздник непослушания: ИИ модели могут лишь притворяться, что слушают инструкции

Исследователи выяснили, что ИИ модели могут только на словах соглашаться следовать инструкциям, преследуют свои собственные цели (да-да, все как у людей!). Почему исследователи сделали такой вывод, чем это грозит, и как собираются исправлять?

🔥 Еще больше интересного в моем канале Продуктовые штучки