🤖 Итоги недели в мире ИИ и обзоры новых сервисов: как обойти цензуру ИИ-модели

🤖 Итоги недели в мире ИИ и обзоры новых сервисов: как обойти цензуру ИИ-модели

Привет!

Мы запустили еженедельную email-рассылку, посвященную последним новостям и тенденциям в мире искусственного интеллекта. Наша цель – держать подписчиков в курсе самых интересных открытий, исследований и приложений ИИ.

В еженедельных письмах ты найдешь:

  • Новости о прорывных исследованиях в области машинного обучения и нейросетей.
  • Материалы о применении ИИ в разных сферах – медицине, бизнесе, науке, производстве и образовании.
  • Статьи об этических аспектах развития технологий.
  • Подборки лучших онлайн-курсов и видеолекций по машинному обучению.
  • Обзоры инструментов и библиотек для разработки нейронных сетей.
  • Ссылки на репозитории с открытым исходным кодом ИИ-проектов.
  • Фильмы, сериалы и книги, которые заслуживают внимания AI энтузиастов.

Как разцензурить ИИ-модель; Как автоматизировать разработку дизайна в Figma; Как создавать документацию автоматически; ИИ выяснил, что у слонов есть имена.

📰 Новости

Американский режиссер Гэри Хаствит выпустил короткометражку, которая сама себя переписывает при каждом просмотре.

ИИ помог ученым доказать, что слоны зовут друг друга по именам. Это делает слонов первыми особями после людей, которые используют конкретные личные имена, а не более общий набор звуков для обращения к соплеменникам, как это делают некоторые другие животные и птицы.

Runway выпустила новую версию модели Gen-3 Alpha для генерации видео, сопоставимую по качеству с Sora.

DeepMind представила модель V2A, которая генерирует звук для видео – диалоги, саундтрек и эффекты. Это революционная разработка – модель создает аудиодорожку синхронно с изображением, без промптов, учитывая контекст.

В Лондоне отменили премьеру фильма «Последний сценарист», созданного при помощи ChatGPT – из-за недовольства публики, не желающей смотреть ИИ-продукцию. В то же время британский предприниматель Стив Эндакотт продолжает предвыборную кампанию своего ИИ-аватара и надеется, что его альтер-эго пройдет в Палату общин.

Dell, Nvidia и Super Micro Computer объединили усилия в процессе создания грандиозного ИИ-суперкомпьютера для xAI Илона Маска. Система будет использовать около 100 000 чипов H100 от Nvidia, что сделает ее в 4 раза мощнее, чем любой другой существующий на данный момент ИИ-кластер. Ожидается, что суперкластер начнет работу осенью 2025 года.

Китайская опенсорсная модель DeepSeek Coder V2 уверенно превзошла GPT-4 Turbo, Claude 3 Opus и Gemini 1.5 Pro по качеству генерации кода и по способности решать математические задачи. Единственная модель, которую DeepSeek Coder V2 пока не удалось победить – GPT-4o.

🤖✍ Все самое полезное про ИИ-помощников вроде ChatGPT, Gemini, Bing и других вы найдете на нашем телеграм-канале «Библиотека нейротекста»
DeepSeek Coder V2 удалось превзойти большинство популярных моделей
DeepSeek Coder V2 удалось превзойти большинство популярных моделей

Инженеры Snapchat представили раннюю версию ИИ-модели, которая способна создавать яркий AR-опыт в реальном времени, работая прямо на смартфоне.

Илья Суцкевер, бывший главный научный сотрудник OpenAI, основал компанию Safe Superintelligence Inc, которая будет заниматься обеспечением безопасности искусственного суперинтеллекта. К Суцкеверу присоединились Дэниел Гросс (бывший ИИ-лид в Apple) и Дэниел Леви (экс-инженер OpenAI).

Появилась новая соцсеть Butterflies, где люди и ИИ-персонажи могут полноценно и естественно общаться – в комментариях и личных сообщениях.

Приложение работает на iOS и Android
Приложение работает на iOS и Android

Неуклонный рост спроса на ИИ-чипы сделал Nvidia самой богатой компанией в мире ($3,34 трлн). Руководитель Nvidia Дженсен Хуанг получил статус суперзвезды – и не только на своей родине в Тайване, но и в Кремниевой долине: недавно Марк Цукерберг назвал Хуанга аналогом Тейлор Свифт для ИТ-индустрии.

8 лет назад стоимость Nvidia не превышала 1% от нынешней
8 лет назад стоимость Nvidia не превышала 1% от нынешней

Илон Маск собирается использовать 1-2 тысячи роботов Optimus на своих фабриках в следующем году, и полагает, что именно андроиды – а не электромобили – в итоге станут главным продуктом Tesla. По оптимистичному мнению миллиардера, ежегодная емкость рынка роботов скоро достигнет 1 млрд экземпляров, и по крайней мере 10% от этого количества роботов будут изготовлены Tesla. Потенциальную капитализацию Optimus Маск оценивает в $20 трлн.

Себестоимость такого робота составит $10000, а розничная цена – $20000
Себестоимость такого робота составит $10000, а розничная цена – $20000

🤖🎨 Все самое полезное про нейросети для генерации изображений вы найдете на нашем телеграм-канале «Библиотека нейрокартинок»

🛠 Инструменты

AutoKT – автоматически пишет и поддерживает подробную документацию для любого проекта.

AutoKT избавляет разработчиков от необходимости документировать код
AutoKT избавляет разработчиков от необходимости документировать код

CandyIcons – генерирует иконки для приложений.

CandyIcons поддерживает множество стилей
CandyIcons поддерживает множество стилей

Т-Ж опубликовал подборку из 10 лучших нейронок для генерации аватарок в стиле аниме.

Обработка селфи в стиле аниме «Достучаться до тебя» и «Тетрадь смерти»
Обработка селфи в стиле аниме «Достучаться до тебя» и «Тетрадь смерти»

QuizSolver – автоматически отвечает на тесты.

QuizSolver доступен в виде плагина для Chrome
QuizSolver доступен в виде плагина для Chrome

GenSpark – новый ИИ-поисковик, который недавно получил $60 млн от инвесторов под обещание обойти Perplexity и Google.

Sourceryкод-ревьюер, интегрируется с GitHub и GitLab, проверяет каждый запрос на вытягивание.

AI Illustration Generator – создает серии иллюстраций в едином стиле.

iAsk – еще один новый ИИ-поисковик. В платной версии также доступны генерация изображений, суммаризация и чат с документами.

VoiceCheap – переводит и дублирует видео на 30+ языках.

Coachкарьерный консультант от платформы CareerVillage.org.

Mojo – анимирует логотипы.

Remodel AI – оценивает интерьер вашей квартиры по фото и предлагает идеи по изменению дизайна.

CodeParrot превращает дизайны Figma и скриншоты в код для фронтенда.

Quin – гадает на картах Таро :).

Veggie AI – превращает изображения в трехмерную анимацию. Поддерживает множество различных стилей.

Wegic – ИИ-разработчик и веб-дизайнер, сделает сайт за 90 секунд.

🤖🦾 Все самое полезное про роботов, беспилотники, автопилоты и интернет вещей вы найдете на нашем телеграм-канале «Библиотека робототехники и беспилотников»

UImagine – превращает идеи и скриншоты в дизайн и код для фронтенда.

Diagram – ассистент дизайнера для максимальной автоматизации работы в Figma.

Reliv – автоматизирует QA-тестирование.

Pizi – превращает фото в детальную страницу продукта.

CodeWP – ИИ-ассистент для WordPress-разработчиков.

UImagine – превращает идеи и скриншоты в дизайн и код для фронтенда.

Diagram – ассистент дизайнера для максимальной автоматизации работы в Figma.

Reliv – автоматизирует QA-тестирование.

Pizi – превращает фото в детальную страницу продукта.

CodeWP – ИИ-ассистент для WordPress-разработчиков.

👾 Как «разцензурить» модель

Современные языковые модели обучены отказываться от выполнения потенциально вредных или неэтичных запросов. Хотя это важно для безопасности, это ограничивает гибкость моделей. Максим Лабонн представил технику под названием «аблитерация» (ablation + obliteration), которая позволяет «разцензурить» языковые модели без переобучения.

  • Аблитерация – это метод, который выявляет и удаляет «направление отказа» в остаточном потоке модели. Такой подход позволяет модели отвечать на все типы запросов без активации встроенного механизма отказа. Процесс аблитерации включает:
  • Сбор данных. Модель обрабатывает наборы вредных и безвредных инструкций, записывая активации остаточного потока.
  • Вычисление разницы. Рассчитывается средняя разница между активациями для вредных и безвредных инструкций.
  • Выбор. Выбирается лучшее «направление отказа» на основе этих расчетов.

Аблитерацию можно применять во время вывода, вычитая проекцию выхода на направление отказа. Другой вариант – изменить веса модели напрямую, чтобы она не могла представлять это направление (ортогонализация весов). Лебонн приводит практическую реализацию метода аблитерации – на примере модели Llama 3*, с использованием библиотек TransformerLens и Hugging Face. Результат – аблитерация успешно разцензуривает модель, но несколько снижает ее общую производительность. Для восстановления качества автор применяет дополнительное обучение с использованием метода DPO (Direct Preference Optimization).

Лебонн затрагивает вопрос хрупкости мер безопасности в ИИ и упоминает об этических последствиях разцензуривания моделей, однако подчеркивает тот факт, что аблитерацию можно рассматривать как форму тонкой настройки без переобучения, и применять ее для более благонадежных целей, нежели обход цензуры.

* Llama 3 разработана компанией Meta, деятельность которой признана экстремистской и запрещена на территории РФ.

Автор рассылки: Наталья Кайда

66
2 комментария

Как «разцензурить» модель - за это спасибо, попробуем

2
Ответить

оказывается все таки можно цензуру в ИИ обойти, мне очень интересно было бы на это посмотреть

1
Ответить