🤖 Итоги недели в мире ИИ и обзоры новых сервисов: главный конкурент ChatGPT получил мощное обновление

Привет!

Мы запустили еженедельную email-рассылку, посвященную последним новостям и тенденциям в мире искусственного интеллекта. Наша цель – держать подписчиков в курсе самых интересных открытий, исследований и приложений ИИ.

В еженедельных письмах ты найдешь:

Новости о прорывных исследованиях в области машинного обучения и нейросетей.
Материалы о применении ИИ в разных сферах – медицине, бизнесе, науке, производстве и образовании.
Статьи об этических аспектах развития технологий.
Подборки лучших онлайн-курсов и видеолекций по машинному обучению.
Обзоры инструментов и библиотек для разработки нейронных сетей.
Ссылки на репозитории с открытым исходным кодом ИИ-проектов.
Фильмы, сериалы и книги, которые заслуживают внимания AI энтузиастов.

✉ Подписаться на рассылку

Ниже ты найдешь сегодняшний 16-й выпуск рассылки.

Роботы в Южной Корее получили права, в Великобритании ИИ скоро заменит соцработников, Amazon объявила о запуске новой инициативы AI Ready, Anthropic выпустила Claude 2.1 и другие новости из мира ИИ.

В Великобритании ИИ скоро заменит соцработников, занятых расследованием мошенничества с пособиями и рассмотрением прошений о предоставлении убежища. С учетом известной расовой предвзятости ИИ и нескольких скандальных прецедентов – это довольно спорная идея.

Microsoft выпустила Orca 2, состоящую из двух моделей (7 млрд и 13 млрд параметров) . В процессе обучения Orca 2 разработчики доказали, что тщательный отбор синтетических данных помогает создавать небольшие модели (в среднем 10 млрд параметров) , которые:

по производительности и способностям к абстрактному мышлению значительно превосходят модели с 70+ млрд параметров;
не нуждаются в огромных вычислительных мощностях.

<p>Orca 2 сопоставима с более крупными моделями или даже превосходит их</p>

Google DeepMind анонсировала модель Lyria, способную генерировать музыку с «живыми» инструментами и вокалом. Модель, в обучении которой принимали участие знаменитые музыканты (включая Джона Ледженда и Сию) , избранные блогеры будут тестировать на платформе YouTube в рамках Dream Track.

В дополнение к существующим 80+ бесплатным курсам по ИИ, компания Amazon объявила о запуске новой инициативы AI Ready, цель которой – предоставить бесплатное обучение навыкам работы с ИИ для 2 миллионов человек к 2025 году. В пресс-релизе отмечается, что профессионалы, использующие ИИ, зарабатывают на 47% больше. Одновременно Amazon уволила несколько сотен сотрудников из команды по разработке ИИ-ассистента Alexa.

В Южной Корее автономным роботам разрешили ездить по тротуарам самостоятельно. До принятия нового «Акта об интеллектуальных роботах» ИИ-машинам требовалось обязательное сопровождение оператора.

Stable Diffusion выпустила новую модель для генерации видео – Stable Video Diffusion. Модель доступна в двух вариантах:

SVD для создания видео с частотой 14 кадров в секунду и разрешением 576x1024.
SVT-XT для генерации видео с частотой 25 кадров.

Bard теперь может смотреть видео и отвечать на вопросы по содержанию. Но, как всегда в случае с Бардом, есть нюансы.

Пока в OpenAI разворачивалась шекспировская драма с увольнением/возвращением отца-основателя, Anthropic выпустила Claude 2.1. Новая модель поддерживает контекст на 200k токенов (против 128k лимита ChatGPT). Это эквивалент 150 000 слов и примерно 500 страниц текста.

Кроме того, модель теперь работает со множеством внешних инструментов, поддерживает системные промпты (для кастомизации) и выдает в 2 раза меньше галлюцинаций, чем предыдущая версия.

Детектор ИИ-текста

Ученые Калифорнийского университета в Беркли разработали Ghostbuster – детектор написанного ИИ текста. Исследователи отмечают, что большие языковые модели, в особенности ChatGPT, научились писать настолько хорошо, что это стало проблемой – студенты начали использовать эти модели для написания работ. При этом существующие ИИ-детекторы часто плохо справляются с данными, отличающимися от тех, на которых они обучались. Довольно часто они ошибочно классифицируют тексты, написанные людьми, как сгенерированные ИИ, что может несправедливо навредить студентам.

<p>Ghostbuster лучше отличает ИИ-текст от человеческого, чем другие детекторы</p>

Ghostbuster устанавливает вероятность генерации каждого токена в тексте при помощи нескольких более слабых языковых моделей, а затем комбинирует функции на основе этих вероятностей в качестве входных данных для финального классификатора. Этот подход позволяет Ghostbuster успешно обрабатывать разные типы текстов, созданные различными моделями. По результатам тестирования Ghostbuster превосходит существующие методы как при оценке тех же данных, на которых модель обучалась, так и при обобщении новых текстов. Протестировать Ghostbuster можно здесь.

Тест: GPT-4(V) vs человек

А в этом исследовании авторы оценили способности текстовой и мультимодальной версий модели GPT-4 к абстрактному мышлению. Для оценки использовался тест ConceptARC, предназначенный для оценки понимания и рассуждений с базовыми концепциями. Спойлер – ни текстовая, ни мультимодальная версии GPT-4 пока не демонстрируют развитые на человеческом уровне способности к абстрактному мышлению:

В первой серии экспериментов авторы тестировали текстовую версию GPT-4, используя подробные инструкции и пример решенной задачи. По этой причине результаты оказались лучше, чем в предыдущих тестах, но все равно модель значительно уступала людям.
Во второй серии для мультимодальной версии GPT-4V задачи представлялись в визуальном виде. Однако ее результаты оказались существенно хуже, чем у текстового варианта.

Авторы делают вывод, что ни одна из версий GPT-4 пока не обладает способностью к устойчивому формированию абстракций и рассуждениям на их основе при столкновении с незнакомыми, выходящими за рамки тренировочных данных ситуациями.

Уровень галлюцинаций

В этом репозитории регулярно составляют список лидеров по галлюцинациям. Постоянный победитель – модель Google Palm 2 Chat, на которой работает Bard.

<p>В этом рейтинге Bard – всегда лидер</p>

Create Real Magic – генератор персонализированных рождественских открыток от компании Coca Cola.

<p>Зима близко – пора генерировать открытки</p>

Dubecos – автоматический перевод и дублирование любых видео на 35 языках.

Simplescraper – соберет данные для создания кастомного чат-бота с любого сайта.

Flawless – выполнит UX-аудит сайта. Похожий сервис – VIZ-X Landing Page Optimizer.

Audio Writer – превращает поток сознания в связный, структурированный, готовый к публикации текст.

HearTheWeb – конвертирует статьи и текст рассылок в подкасты.

Trace – сделает SwiftUI интерфейс для мобильного приложения.

ChatDesigner – продвинутый генератор изображений и ИИ-дизайнер: сделает 3D-сцену из фото, наденет одежду на модель, нарисует портрет в любом стиле, дорисует нужные детали.

QuizRise – создает квизы на основе промптов и любого контента – книг, лекций. Поддерживает ссылки на онлайн-материалы. Похожий сервис – QuizGecko.

UI Sketcher – превращает наброски и эскизы в UI. Использует ChatGPT-4 Vision.

UI Sketcher нарисует интерфейс по любому эскизу

Musicfy – создает музыкальные треки на основе голоса пользователя.

RAGs – Streamlit-приложение для создания чат-бота, работающего на ваших собственных данных.

GPT Crawler – собирает контент с выбранных сайтов для создания кастомных чат-ботов на платформе OpenAI. Отлично подходит для создания интерактивной документации и личных помощников.

Nougat-LaTeX – генерирует LaTeX-код, распознавая формулы на изображениях.

MetaDreamer – в течение 20 минут создает 3D-модели по текстовым промптам.

Draw-a-ui – с помощью GPT-4 Vision генерирует HTML/CSS код UI/UX элементов на основе эскизов и набросков. Похожий проект – Screenshot-to-code, он превращает скриншоты в HTML/Tailwind CSS, и к тому же генерирует похожие изображения с помощью DALLE-3. Вот так он клонирует интерфейс Ютуба.

Mustango – контролируемый генератор музыки.

Krita – впечатляющая опенсорсная версия ИИ-плагина Generative Fill/Expand для Photoshop: дорисовывает изображение и вставляет дополнительные объекты. Имеет дополнительную функциональность – повышает разрешение до 4k-8k, рисует в реальном времени, поддерживает фотореференсы и кастомизацию.

И напоследок – если любите аниме и мир «Бегущего по лезвию», не пропустите выдающийся мини-сериал «Плутон» от Netflix: это новый взгляд на старую тему эксплуатации людьми разумных роботов.

Еще одна достойная просмотра новинка – «Создатель», где закаленный агент получает задание найти и уничтожить архитектора сверхразумного ИИ.

Автор: Наталья Кайда

✉ Подписаться на рассылку

🤖 Итоги недели в мире ИИ и обзоры новых сервисов: главный конкурент ChatGPT получил мощное обновление

📰 Новости

🔬 Исследования

🛠 Инструменты

🪛 Сделай сам