{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

AI-видеопоздравление за 5 минут: HeyGen vs. D-iD + бонус

Сейчас нейросети умеют не только рисовать фотореалистичные изображения, но и превращать их видео. Причем этим совершенно бесплатно может воспользоваться каждый, кто умеет выходить в интернет. Но насколько хорош результат? Мы создали новогоднее поздравление с помощью двух бесплатных сервисов генерации AI-видео, и предлагаем сравнить, что получилось.

HeyGen — празднично (но недолго)

Главные функции нейросети HeyGen, ранее носившей имя Movio, это:

  • преобразование текста в речь (поддерживает более 40 языков) для озвучивания видео;
  • генерация видеороликов с AI-аватарами, в том числе пользовательскими;
  • «оживление» фотографий.

Последней опцией мы и воспользовались. Работать максимально просто: нажимаем «Create Video», переходим во вкладку «Photo Avatar», загружаем фото, пишем текст (генерируем его встроенной текстовой нейросетью или грузим свою аудиодорожку), и выбираем голос. Точнее, выбора по сути нет: для озвучивания на русском языке доступно лишь по одному мужскому и женскому голосу.

Далее, жмем «Submit», и генерируется ролик — он размещен как заглавное видео этой статьи. Скачать видео можно в разрешении 720p и 1080p (и 4K — только на платных тарифах).

В целом анимация нравится. Особенно — максимально праздничное выражение лица, перешедшее с исходного фото. Но вид несколько портят излишне частые, на наш взгляд, моргания.

На бесплатном тарифе доступен 1 кредит, который соответствует 1 минуте видео. Списание выполняется с округлением до 30 секунд, так что в месяц бесплатно можно создать максимум два ролика продолжительностью не более полминуты, или один — длительностью от 30 до 60 секунд.

Стоимость платных тарифов стартует с $29, за которые выдается 15 кредитов-минут. Правда, российские банковские карты (немного предсказуемо) не принимаются.

D-iD — больше серьезности (и возможностей)

Прямой конкурент HeyGen — нейросеть D-iD. Она привлекает в первую очередь приличными возможностями бесплатной версии: здесь каждому доступны 5 минут видео, причем время списывается по 15 секунд. Да и платные тарифы более чем в 3 раза дешевле, чем в HeyGen: за $5,9 предоставляют 10 минут, за $9,4 — 16 минут (российские карты также не принимаются).

Процесс создания видео из фото аналогичен предлагаемому HeyGen.

Поле «Название видео» на D-iD работает как-то неправильно: справа —налево :)

Для русскоязычных пользователей у D-iD есть еще одно важное преимущества: она предлагает: два мужских и четыре женских голоса для озвучивания текстов на русском языке.

Кстати, судя по всему, HeyGen и D-iD использует голоса из общей библиотеки. Оба наших видео озвучены голосами с одинаковым названием Dmitry — сравните.

А еще прямо в D-iD можно попросить нарисовать своего AI-персонажа. Для упрощения этой задачи предлагаются готовые промпты. На бесплатном тарифе доступны 15 запросов, по каждому из которых генерируется по 4 изображения.

Такие персонажи сгенерировались по предложенному D-iD промпту, описывающему фотореалистичное изображение женщины-юриста.

А в результате оживления нашего исходного фото получилось это:

D-iD несколько упростил себе задачу, лишив нашего персонажа очаровательной улыбки. Из-за этого чуть прищуренные глаза смотрятся раскосыми )

Зато моргания получились более естественными. Разрешение видео осталось таким же, как и у загруженного изображения: 1024×576.

Бонус: импортозамещение (нет)

Когда искали, где можно быстро и бесплатно сделать видео из картинки, попался еще сервис Visper. Судя по информации с официального сайта — это разработка принадлежащему «Сберу» ООО «СалютДевайсы». По задуманному функционалу он аналогичен рассмотренным сервисам, а в чем-то даже интересней. Например, предусмотрены жесты вроде махания рукой и указания в сторону (где может размещаться дополнительная картинка).

Бесплатно выдаются две минуты видео, но возможности сильно ограничены: даже скачать готовый ролик нельзя. Зато докупать время в теории можно поминутно, по цене от 90 р./минуту.

И это все было бы хорошо, если бы не одно «но»: Visper находится он ни то в зачаточном, ни то в мертворожденном состоянии: анимация по факту не работает.

В то же время, если сервис «допилят» и сохранят заявленные цены — должен получится интересный вариант, особенно для российских пользователей.

Заключение

Да, сейчас нейросети позволяют бесплатно и буквально за 5 минут оживлять изображения. Из рассмотренных вариантов для любительского использования более выигрышно смотрится D-iD за счет привлекательных условий бесплатного тарифа. Хотя в конкретном случае ролик от HeyGen нам нравится больше :)

Но генерация AI-видео на серьезном уровне, как и любой другой процесс, требует значительных вложений времени, знаний, денег. Мы уже работаем в этом направлении. И напоследок, хотелось бы узнать ваше мнение:

Какое AI-видеопоздравление вам нравится больше?
Улыбчивое от HeyGen
Серьезное от D-iD
Все ерунда, оживлять фото нужно в … (напишу вариант в комментарии)
Показать результаты
Переголосовать
Проголосовать
0
2 комментария
Алина Григорьева

Спасибо, что делитесь подробно как сделать крутое видео с помощью нейросети. Но мне больше нравятся снятые вживую! Конечно, сейчас интенет творит чудеса и есть много всего интересного!

Ответить
Развернуть ветку
Вика Марченко

Такое видео необычное. Мне понравилось

Ответить
Развернуть ветку
-1 комментариев
Раскрывать всегда