Как оживить статичное фото: сравниваю четыре нейросети

Недавно решила протестировать сразу четыре инструмента, которые позволяют «оживлять» статичные изображения. Задача была простой: сделать плавную анимацию, не искажая пропорции и не добавляя каких-либо странных артефактов (например, лишние руки или «плывущее» лицо).

Для эксперимента я взяла одно и то же свое нейрофото и загрузила его по очереди в Sora, Minimax, Kling и Runway. Все сервисы доступны в одном месте (через бота Syntx), что упрощает процесс тестирования.

ч/б нейрофото
ч/б нейрофото

Хотелось добиться эффекта лёгкой анимации, максимально приближённой к реальности.

4 место — Sora

С Sora у меня пока не складывается. Когда речь идёт о преобразовании текста в видео, сервис показывает более-менее приличный результат, но оживление готового изображения явно хромает. Вместо плавного движения получилось нечто странное, что никак не соответствовало моему запросу.

Вердикт: возможно, Sora хорош в других сценариях, но для простой задачи «анимировать статичное фото» есть варианты получше.

3 место — Runway

С Runway ситуация оказалась чуть лучше, но здесь нейросеть «сломала» мне руку: похоже, алгоритм неверно сгенерировал пропорции. В итоге анимация получилась динамичной, но явно с изъяном. Для короткого ролика — пойдёт, но если нужен аккуратный результат, могут возникнуть проблемы.

2 место — Minimax

У Minimax получилось уже заметно лучше. Движения получились естественными, лицо не «плывёт». Однако была небольшая «роботизированность» движений. В целом — достойный вариант, особенно если нужно быстро принять решение.

1 место — Kling

Вот кто действительно удивил. Я не так часто пользовалась Kling, но в этом тесте он показал максимально реалистичную анимацию:

  • Ни один палец не потерялся,
  • Не было добавлено лишних объектов,
  • Камера плавно и кинематографично «двигалась»,
  • Лицо оставалось целым и не меняло форму.

По итогам эксперимента Kling — мой личный фаворит для анимации статичных фотографий.

результат с Kling

Итоговый рейтинг

  • Kling — точное, плавное и реалистичное оживление.
  • Minimax — неплохой результат, но ощущается небольшая «искусственность».
  • Runway — может «нарушить» пропорции при генерации, но иногда даёт интересные эффекты.
  • Sora — у меня результат вышел совсем не соответствующим запросу.

Несколько советов

  • Пропишите чёткий запрос. Если попросить «просто оживить фото», нейросеть может сделать что-то своё. Лучше уточнить, какой именно эффект вам нужен: плавные движения, лёгкие повороты головы и т. д.
  • Не забывайте про тесты. Часто в одном и том же сервисе можно несколько раз сгенерировать анимацию, добиваясь всё более подходящего варианта.
  • Учитывайте специфику. Некоторые нейросети лучше справляются с преобразованием текста в видео, другие — с анимацией готовых снимков. Не бойтесь сравнивать и искать то, что лучше подходит для вашего проекта.

Мой Telegram-канал о нейросетях и технологиях — делюсь находками из мира ИИ, даю лайфхаки и помогаю использовать нейросети эффективно. Ссылку на бот Syntx можно найти там же.

1
Начать дискуссию