🤖 Итоги недели в мире ИИ и обзоры новых сервисов: ИИ читает обугленные свитки и защищает пользователей от кетфишинга

🤖 Итоги недели в мире ИИ и обзоры новых сервисов: ИИ читает обугленные свитки и защищает пользователей от кетфишинга

Привет!

Мы запустили еженедельную email-рассылку, посвященную последним новостям и тенденциям в мире искусственного интеллекта. Наша цель – держать подписчиков в курсе самых интересных открытий, исследований и приложений ИИ.

В еженедельных письмах ты найдешь:

  • Новости о прорывных исследованиях в области машинного обучения и нейросетей.
  • Материалы о применении ИИ в разных сферах – медицине, бизнесе, науке, производстве и образовании.
  • Статьи об этических аспектах развития технологий.
  • Подборки лучших онлайн-курсов и видеолекций по машинному обучению.
  • Обзоры инструментов и библиотек для разработки нейронных сетей.
  • Ссылки на репозитории с открытым исходным кодом ИИ-проектов.
  • Фильмы, сериалы и книги, которые заслуживают внимания AI энтузиастов.

Исследователи обнаружили, что чат-боты склонны делать выбор в пользу насилия и ядерных ударов в военных играх; ИИ эффективно защищает пользователей от романтического скама и кетфишинга; новый метод обучения LLM генерации сложного кода; и многое другое.

📰 Новости

Исследователи Стэнфордского университета обнаружили, что чат-боты (включая ботов компании OpenAI, которая недавно начала сотрудничать с Пентагоном) склонны делать выбор в пользу насилия и ядерных ударов в военных играх, даже если у них есть множество других опций разрешения конфликта.

В прошлом году ИИ впервые был использован для расшифровки свитка, обугленного при извержении Везувия почти 2000 лет назад. Работа продолжается, и исследователи уже достигли серьезных успехов – расшифровали фрагмент ранее неизвестной философской работы, посвященной чувственным удовольствиям – вкусу каперсов, красоте пурпурного цвета и музыке. Предположительно, ее автор – древнегреческий философ Филодем, последователь Эпикура. Илон Маск уже пообещал профинансировать следующий раунд соревнования The Vesuvius Challenge, благодаря которому был прочитан этот фрагмент.

Microsoft добавила в Copilot новую модель Deucalion, а также впечатляющую функциональность для кастомизации и точечного редактирования сгенерированных изображений. Компания пообещала в скором времени выпустить Designer GPT, в котором креативных возможностей будет еще больше.

ИИ эффективно защищает пользователей от романтического скама и кетфишинга: разработчики Bumble (приложение для знакомств) протестировали новую AI-функцию Deception Detector (детектор обмана), которая автоматически заблокировала 95% мошеннических аккаунтов. В течение первых двух месяцев тестирования количество жалоб на спам, мошенничество и поддельные аккаунты сократилось на 45%. Романтический скам – очень серьезная проблема для соцсетей и дейтинговых сервисов: в 2022 году мошенники выудили у доверчивых пользователей не менее $1,3 млрд. Средняя сумма ущерба составляет $4400, а схема обмана обычно выглядит так.

Google создала MobileDiffusion – мини-модель для супербыстрой генерации изображений на смартфонах.

🛠 Инструменты

Galileo AI – генерирует стильные интерфейсы по текстовым описаниям и скриншотам.

Примеры UI, сделанных Galileo
Примеры UI, сделанных Galileo

UserSketch – создает чат-бота на основе единой базы знаний с данными, собранными из любых документов, почты, мессенджеров, приложений для управления проектами и организации бизнес-процессов.

Ytube AI – превращает YouTube-видео в SEO-оптимизированные статьи.

ThreadScribe.ai – превращает сообщения из Slack в структурированную базу знаний, которой можно задавать любые вопросы и получать инсайты.

AgentHub – автоматизирует любые процессы, от управления бизнесом и решения задач по программированию до создания учебных материалов и найма сотрудников.

Wondera – споет любую песню вашим голосом.

Agent Gold – предоставляет возможность побеседовать с любым ютубером.

Zoviz – генерирует логотипы и фирменный стиль.

Fooocus – бесплатная опенсорсная альтернатива Midjourney. Устанавливается локально.

Fooocus генерирует суперкачественные изображения по максимально простым промптам
Fooocus генерирует суперкачественные изображения по максимально простым промптам

AI Poem Generator – генерирует стихотворения в любых стилях и жанрах. Поддерживает множество языков, но самые лучшие результаты выдает на английском.

🪛 Сделай сам

Разработчики Apple выпустили опенсорсную модель MGIE для редактирования фото с помощью промптов: пользователю достаточно объяснить, что именно нужно сделать с изображением. Подробное описание принципов работы MGIE – в этой pdf-публикации.

<p>Модель может добавить овощей на пиццу с салями, чтобы она выглядела «здоровее»</p>

Модель может добавить овощей на пиццу с салями, чтобы она выглядела «здоровее»

<p>Или превратить коттедж в особняк</p>

Или превратить коттедж в особняк

Google выпустила инструмент localllm для запуска LLM локально или в облаке, на CPU вместо GPU. Подробный туториал по установке и настройке localllm – в блоге разработчиков.

Видеотуториал покажет, как сделать игру за 60 минут с помощью ChatGPT.

🔬 Исследования

Новый метод обучения LLM генерации сложного кода

Сотрудники Хуачжунского университета науки и технологии (Китай) совместно с исследователями Королевского технологического института (Швеция) создали фреймворк StepCoder – новый метод улучшения генерации кода с помощью подкрепления из фидбека компилятора.

Основная цель StepCoder – повышение качества сгенерированного кода. Хотя существующие модели показывают впечатляющие результаты в генерации кода по относительно простым запросам, они пока не могут генерировать полностью рабочий код для решения сложных практических задач. Авторы используют подкрепление из обратной связи компилятора (результаты компиляции, выполнения юнит-тестов и т. д.), что позволяет определить корректность сгенерированного кода.

<p>Отличие метода StepCoder от традиционного обучения с подкреплением</p>

Отличие метода StepCoder от традиционного обучения с подкреплением

В StepCoder задействованы два ключевых компонента:

  • CCCS – последовательное выполнение подзадач. Этот компонент разбивает сложную задачу генерации кода на более простые подзадачи дополнения неполного кода. Изначально модели дается большая часть готового кода, который нужно дополнить небольшим фрагментом. По мере обучения сложность возрастает за счет увеличения доли кода, который должна сгенерировать сама модель. Такой постепенный подход позволяет эффективнее обучить модель решать сложные задачи полной генерации кода по запросу на естественном языке.
  • FGO – тонкая оптимизация. Этот компонент оптимизирует модель, учитывая при анализе подкрепления из фидбека компилятора только те фрагменты сгенерированного кода, которые были выполнены при запуске юнит-тестов. Фрагменты кода, не влияющие на результат, игнорируются. Это позволяет более точно оптимизировать модель в нужном направлении.

Эксперименты показали, что StepCoder повышает точность генерации кода гораздо эффективнее, чем любые другие подходы, основанные на подкреплении.

ИИ-агент для игр из серии Pokémon

Исследователи из Технологического института Джорджии представили PokéLLMon. Возможности этого ИИ-агента сопоставимы с человеческими – он уже выиграл 56% боев против людей. Авторы также нашли способ избавиться от галлюцинаций и решили проблему панического переключения, когда при столкновении с сильным противником агент начинал хаотично переключаться между покемонами.

<p>Агент способен обучаться в контексте, может мгновенно корректировать тактику действий</p>

Агент способен обучаться в контексте, может мгновенно корректировать тактику действий

Супербыстрый метод генерации 3D моделей

Исследователи Университета Торонто и Научно-технологического университета KAUST представили новаторский метод генерации моделей по текстовым промптам – AToM. Результаты впечатляют:

  • В отличие от существующих подходов, которые требуют длительной оптимизации для каждого промпта, AToM позволяет генерировать 3D модели в виде текстурированных полигональных сеток для множества разных описаний одновременно, без необходимости переобучения.
  • Благодаря двухэтапной стратегии амортизированной оптимизации, AToM демонстрирует стабильность и масштабируемость.
  • AToM генерирует высококачественные 3D модели менее чем за 1 секунду, с 10-кратным сокращением вычислительных затрат на обучение по сравнению с существующими подходами, и к тому же использует минимальный набор данных.
  • Метод продемонстрировал высокую точность и лучшее соответствие текстовым описаниям по сравнению с другими решениями, а также хорошую обобщающую способность для неизвестных промптов.
Пайплайн AToM
Пайплайн AToM

Автор рассылки: Наталья Кайда

44
Начать дискуссию