EMO AI: конкурент Sora?

Пока мы все в ожидании Sora от OpenAI, группа исследователей компании Alibaba (известная нам по Aliexpress) представила свой искусcтвенный интеллект, который способен оживить изображение — EMO AI.

EMO AI: AI Lady from SORA  

EMO является аббревиатурой "Emote Portrait Alive" и представляет собой модель искусственного интеллекта cпособную генерировать видео на основе портретного изображения и аудио.

Принцип работы EMO AI (Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fhumanaigc.github.io%2Femote-portrait-alive%2F&postId=1055866" rel="nofollow noreferrer noopener" target="_blank">https://humanaigc.github.io/emote-portrait-alive/</a>) 
Принцип работы EMO AI (Источник: https://humanaigc.github.io/emote-portrait-alive/

Для создания видеоролика пользователю достаточно загрузить изображение какого-нибудь персонажа и аудио дорожку (это может быть любая музыкальная композиция или записанный разговор), а нейросеть создаст реалистичный видео аватар.

Исследователи отмечают, что данная модель искусственного интеллекта была обучена на 250 часов видео- материала и 150 миллионов изображений. Стоит обратить внимание на то, что при создании анимации ИИ не использует 3D-модели, что позволяет воспроизводить плавные движения лица персонажа, делая его более естественным.

EMO AI cпособна генерировать следующие типы видео:

  • «Поющие» портреты

Загрузив портретное изображение и песню, нейросеть может создать видео персонажа, который поёт. Также она способна синхронизировать картинку под ритм и текст песни. Например с её помощью Леонардо ДиКаприо может читать рэп как Eminem (полное видео можно увидеть здесь).

EMO AI: Леонардо ДиКаприо + EMINEM - GODZILLA (FT. JUICE WRLD) COVER 
  • Персонаж говорящий на разных языках

Данный искусственный интеллект способен генерировать видео с аудио на различных языках — от английского до китайского. Это возможно благодаря распознанию языковой тональности и созданию на основе этого мимики персонажа.

Таким образом, EMO AI позволяет анимировать любой портрет (например, с любимым киногероем) с возможностью создания монолога или выступления в разных стилях. К примеру, с помощью фотографии Одри Хепбёрн и голосового аудио можно сгенирировать полноценное интервью (видео вы можете посмотреть здесь).

Чем же EMO AI отличается от остальных ИИ по созданию видео?

  • Высокое качество видео;
  • Реалистичность изображения;
  • Создание видео без ограничений по времени;
  • Поддержка многих языков.

На данный момент дата выхода EMO AI пока не известна, но можно смело утверждать, что нейросеть превосходит многих своих конкурентов. Данная технология может стать полезной для маркетинга, индустрии развлечений и даже в обучении.

Однако, не стоит забывать о возможных последствиях и использовании искусственного интеллекта в недобросовестных целях. Поэтому необходимо найти нужный баланс между его способностями и этичностью их применения.

По всем вопросам: @rpa_solutions

Поговорить с нашим умным ботом: @Airpa_bot

2929
11
6 комментариев

404 по ссылке на гитхаб(

1
Автор

Спасибо, исправили!

Есть готовый уже и бесплатный аналог, можно поиграть. Но не настолько крутая конечно) https://real3dportrait.github.io/

Автор

Достаточно интересная разработка, но всё же проигрывает EMO AI, так как не передаёт полноценно естественность движений лица. Но в качестве алтернативы можно использовать :)

1

лол, этой технологии примерно миллион лет, сообственно Тик-Ток с нее начался, когда в musical.ly этот фильтр добавили