EMO AI: конкурент Sora?
Пока мы все в ожидании Sora от OpenAI, группа исследователей компании Alibaba (известная нам по Aliexpress) представила свой искусcтвенный интеллект, который способен оживить изображение — EMO AI.
EMO является аббревиатурой "Emote Portrait Alive" и представляет собой модель искусственного интеллекта cпособную генерировать видео на основе портретного изображения и аудио.
Для создания видеоролика пользователю достаточно загрузить изображение какого-нибудь персонажа и аудио дорожку (это может быть любая музыкальная композиция или записанный разговор), а нейросеть создаст реалистичный видео аватар.
Исследователи отмечают, что данная модель искусственного интеллекта была обучена на 250 часов видео- материала и 150 миллионов изображений. Стоит обратить внимание на то, что при создании анимации ИИ не использует 3D-модели, что позволяет воспроизводить плавные движения лица персонажа, делая его более естественным.
EMO AI cпособна генерировать следующие типы видео:
- «Поющие» портреты
Загрузив портретное изображение и песню, нейросеть может создать видео персонажа, который поёт. Также она способна синхронизировать картинку под ритм и текст песни. Например с её помощью Леонардо ДиКаприо может читать рэп как Eminem (полное видео можно увидеть здесь).
- Персонаж говорящий на разных языках
Данный искусственный интеллект способен генерировать видео с аудио на различных языках — от английского до китайского. Это возможно благодаря распознанию языковой тональности и созданию на основе этого мимики персонажа.
Таким образом, EMO AI позволяет анимировать любой портрет (например, с любимым киногероем) с возможностью создания монолога или выступления в разных стилях. К примеру, с помощью фотографии Одри Хепбёрн и голосового аудио можно сгенирировать полноценное интервью (видео вы можете посмотреть здесь).
Чем же EMO AI отличается от остальных ИИ по созданию видео?
- Высокое качество видео;
- Реалистичность изображения;
- Создание видео без ограничений по времени;
- Поддержка многих языков.
На данный момент дата выхода EMO AI пока не известна, но можно смело утверждать, что нейросеть превосходит многих своих конкурентов. Данная технология может стать полезной для маркетинга, индустрии развлечений и даже в обучении.
Однако, не стоит забывать о возможных последствиях и использовании искусственного интеллекта в недобросовестных целях. Поэтому необходимо найти нужный баланс между его способностями и этичностью их применения.
По всем вопросам: @rpa_solutions
Поговорить с нашим умным ботом: @Airpa_bot
Ненавижу копирайтинг. Тот самый "правильный" копирайтинг, которому учат на курсах за 50 тысяч. С его формулами AIDA, болевыми точками и призывами к действию.
ЦБ оставил ключевую ставку 21%, сигнал дал умеренно жёсткий, так что и вся неделя получилась жёсткой. Рубль тоже жёсткий, никак не обмякнет. В акциях, облигациях и крипте всё спокойно, а вот недвижка продолжает пробивать обратное дно. Новые максимумы рисует, ещё и льготные ипотеки расширяют. Из позитивного можно выделить новые дивиденды, ну и наш с…
Колдунщик — это главный блок поисковой выдачи и мощный источник целевых клиентов для тех, кто продвигает компанию на Яндекс Картах. Как оказаться в Колдунщике и занять место на первых позициях — рассказал в статье.
- Сезон выгорания, гадости про скрам, матрицы ролей, 5 почему, кейсы от крупняков, тренды в управлении проектами и всё интересное, что писали на этой неделе про управление проектами
- Мы прочитали все публикации и выбрали для вас самые крутые и полезные. Читайте, сохраняйте и применяйте!
- Расширенные дайджесты, новости, обзоры книг и курсов для РП и анали…
Посетила салон «Точка красоты» на Ленинском просп., д 109 (ТРЦ «РИО», 3 этаж) и получила обрубки на голове, хамство администраторов и игнорирование закона РФ от владельцев данного заведения. В статье расскажу, как я пыталась вернуть деньги за некачественную услугу и чем это закончилось.
Верховный суд рассмотрел спор о взыскании убытков с банка за неисполнение поручения клиента.
Линкедин — это не просто платформа, где все публикуют резюме, ищут сотрудников или хвастаются офисными кактусами. Это гигантская база данных, где каждый профиль — открытая дверь для холодных, но горячих сделок.
Майнинг запрещён в 13 регионах России.
404 по ссылке на гитхаб(
Вот верная: https://humanaigc.github.io/emote-portrait-alive/
Спасибо, исправили!
Есть готовый уже и бесплатный аналог, можно поиграть. Но не настолько крутая конечно) https://real3dportrait.github.io/
Достаточно интересная разработка, но всё же проигрывает EMO AI, так как не передаёт полноценно естественность движений лица. Но в качестве алтернативы можно использовать :)
лол, этой технологии примерно миллион лет, сообственно Тик-Ток с нее начался, когда в musical.ly этот фильтр добавили