Как оживить статичное фото: сравниваю четыре нейросети
Недавно решила протестировать сразу четыре инструмента, которые позволяют «оживлять» статичные изображения. Задача была простой: сделать плавную анимацию, не искажая пропорции и не добавляя каких-либо странных артефактов (например, лишние руки или «плывущее» лицо).
Для эксперимента я взяла одно и то же свое нейрофото и загрузила его по очереди в Sora, Minimax, Kling и Runway. Все сервисы доступны в одном месте (через бота Syntx), что упрощает процесс тестирования.
Хотелось добиться эффекта лёгкой анимации, максимально приближённой к реальности.
4 место — Sora
С Sora у меня пока не складывается. Когда речь идёт о преобразовании текста в видео, сервис показывает более-менее приличный результат, но оживление готового изображения явно хромает. Вместо плавного движения получилось нечто странное, что никак не соответствовало моему запросу.
Вердикт: возможно, Sora хорош в других сценариях, но для простой задачи «анимировать статичное фото» есть варианты получше.
3 место — Runway
С Runway ситуация оказалась чуть лучше, но здесь нейросеть «сломала» мне руку: похоже, алгоритм неверно сгенерировал пропорции. В итоге анимация получилась динамичной, но явно с изъяном. Для короткого ролика — пойдёт, но если нужен аккуратный результат, могут возникнуть проблемы.
2 место — Minimax
У Minimax получилось уже заметно лучше. Движения получились естественными, лицо не «плывёт». Однако была небольшая «роботизированность» движений. В целом — достойный вариант, особенно если нужно быстро принять решение.
1 место — Kling
Вот кто действительно удивил. Я не так часто пользовалась Kling, но в этом тесте он показал максимально реалистичную анимацию:
- Ни один палец не потерялся,
- Не было добавлено лишних объектов,
- Камера плавно и кинематографично «двигалась»,
- Лицо оставалось целым и не меняло форму.
По итогам эксперимента Kling — мой личный фаворит для анимации статичных фотографий.
Итоговый рейтинг
- Kling — точное, плавное и реалистичное оживление.
- Minimax — неплохой результат, но ощущается небольшая «искусственность».
- Runway — может «нарушить» пропорции при генерации, но иногда даёт интересные эффекты.
- Sora — у меня результат вышел совсем не соответствующим запросу.
Несколько советов
- Пропишите чёткий запрос. Если попросить «просто оживить фото», нейросеть может сделать что-то своё. Лучше уточнить, какой именно эффект вам нужен: плавные движения, лёгкие повороты головы и т. д.
- Не забывайте про тесты. Часто в одном и том же сервисе можно несколько раз сгенерировать анимацию, добиваясь всё более подходящего варианта.
- Учитывайте специфику. Некоторые нейросети лучше справляются с преобразованием текста в видео, другие — с анимацией готовых снимков. Не бойтесь сравнивать и искать то, что лучше подходит для вашего проекта.
Мой Telegram-канал о нейросетях и технологиях — делюсь находками из мира ИИ, даю лайфхаки и помогаю использовать нейросети эффективно. Ссылку на бот Syntx можно найти там же.
Многие уже пробовали сгенерировать качественные тексты в ChatGPT и реалистичные картинки (без искажений и лишних пальцев) в Midjourney. Однако бесплатно сгенерировать изображения в Midjourney не получится, а для пользования ChatGPT понадобится зарегистрировать аккаунт в ChatGPT с использованием VPN, а для покупки подписки Plus из России придется ещ…
В пути товар может разбиться или сломаться, его могут потерять или конфисковать на таможне. Такое случается редко, но и предугадать форс-мажор невозможно.
Пока индустрия ИИ замерла в ожидании Midjourney V7, Google выпустил Imagen 3, и это может полностью изменить расстановку сил на рынке генерации изображений. В этой статье — детальное сравнение трех главных игроков рынка, анализ их возможностей и практические рекомендации по использованию каждого инструмента. Вы узнаете, почему Google может стать но…
Я — маркетолог в бьюти-сфере и активно изучаю новые технологии для продвижения брендов.
В этой статье расскажу о простых и эффектных инструментах, которыми мы иногда пользуемся в студии. Они помогают ускорить работу с графикой, текстами и просто повеселиться)
Всем вам уже надоели эти Телеграм эксперты, которые трубят из каждой подворотни о том, что Телеграм - это лучшая ниша. Но лично я на своем опыте убедился в обратном, и давайте разберем, как же это было
Видео с эффектами, как будто снятое на дорогую камеру — это уже не только про съёмочную группу, студию и монтаж. Сегодня такие видео можно сделать прямо с телефона — с помощью нейросети Kling.
Ребят, хочу с вам поделиться своими маленькими наработками, опытом и примерами генераций: в боте в телеграме, которым я пользуюсь уже давно, есть доступ к Sora — да, той самой, про которую все говорят, когда обсуждают фотореализм в AI-видео. И работает она очень круто, может выдавать 20 секундные ролики в 720p и 10 секундные в 1080p.
Иногда хочется буквально «собрать» идеальный день из отдельных фрагментов: море, кофе… Даже если в реальности пока нет возможности сбежать к морю, это можно устроить виртуально — благодаря новой функции Elements в Kling. Делюсь свежим опытом, как я собрала пару кадров и получила необычные ролики.