Нейросети для генерации видео: тестируем 6 бесплатных сервисов
Luma AI
Luma AI — компания, которой принадлежит Dream Machine. Нейросеть, которая умеет оживлять изображения и генерировать видео по описанию.
Что умеет
Сервис создаёт пятисекундные видео. Их особенность — плавное движение и кинематографичность. Можно оживлять фото, картинки или обратиться к нейросети с текстовым запросом.
Бесплатная версия
Каждый пользователь автоматически получает тариф Free и 30 бесплатных генераций в месяц (и не более 10 запросов в день). Коммерческое использование видео запрещено, а результат сохраняется с водяным знаком.
Платная версия
Цены на платные тарифы стартуют от $29.99 — во столько обойдётся пакет Standard. Это 120 дополнительных генераций в месяц, приоритет в очереди и право на коммерческое использование контента без водяного знака. В день можно отправлять неограниченное количество запросов.
Более продвинутые тарифы отличаются от предыдущего увеличенными лимитами генераций и меньшим временем ожидания:
- Plus. $64.99 — 280 генераций в месяц.
- Pro. $99.99 — 450 генераций в месяц.
- Premier. $499.99 — 2400 генераций в месяц.
При оплате подписки по любому тарифу на год вперёд дают скидку 20%.
Языки
Интерфейс на английском языке, но промпты можно писать и на русском.
Как использовать Luma AI
Наблюдения
Luma не всегда точно понимает запрос на отличном от английского языке. Генерирует в зависимости от загрузки сервера: создание ролика может занять несколько минут, а в противном случае нейросеть откажется выполнять команду до снижения нагрузки. Чтобы создать идеальный промпт, надо подробно описывать все желаемые детали, учитывать эмоции и атмосферу будущего видео и постараться обойтись без сложных терминов и жаргонизмов.
Результаты
Плюсы:
- Реалистичность и высокая детализация.
- Доступность без VPN.
Минусы:
- Проблемы с русским языком.
- Нельзя оплатить картой российского банка.
- Могут возникать проблемы с качеством генерации и точностью движений/объектов/текста.
Подробный гайд по нейросети:
Runway
Runway — многофункциональный сервис, позволяет создавать и редактировать изображения, аудио- и видеоролики.
На платформе представлено три модели AI. Gen-1 преображает готовые видео, Gen-2 создаёт их с нуля, а Gen-3 Alpha, по словам создателей, делает ролики более точными и согласованными по движению в сравнении с Gen-2.
Что умеет
Создавать и редактировать изображения, аудио и видео по фото, текстовым запросам и видео. Первые две модели можно протестировать бесплатно, а за использование Gen-3 нужно заплатить минимум 12 долларов. Поэтому, если вы хотите бесплатно создать ролик с нуля, используйте версию Gen-2.
Бесплатная версия
Нельзя купить больше кредитов, увеличить разрешение видео или удалить водяные знаки. Бесплатно доступны:
- 125 кредитов без срока действия;
- преображение видео в Gen-1 — до 4 секунд;
- генерация видео с нуля в Gen-2 — до 16 секунд;
- 3 видеопроекта;
- 5 Гб активов.
Платная версия
В платных версиях нет водяных знаков и становится доступной Gen-3 Alpha. Доступны четыре подписки — по 12, 28, 76 и 125 долларов. Между собой различаются опциями:
- улучшается разрешение;
- увеличивается количество кредитов, гигабайт, секунд и членов команды.
Стоимость кредитов для генерации видео
- 1 секунда Gen-1 — 14 кредитов.
- 1 секунда Gen-2 — 5 кредитов.
- 1 секунда Gen-3 Alpha — 10 кредитов.
Языки
Интерфейс на английском языке, запросы на русском нейросеть не понимает.
Как использовать Runway Gen-3 Alpha
- Зарегистрируйтесь на сайте — сервис работает без VPN.
- Выберите «Introducing Gen-3 Alpha» и нажмите кнопку «Get started».
- Вам в любом случае предложат обновить текущую модель Gen-2 до Gen-3. Нажмите «Try to later» — откроется бесплатная версия Gen-2.
Если захотите протестировать Gen-3, нажмите кнопку «Upgrade to try» — появится окошко с предложением приобрести платную подписку.
- Введите текстовый запрос на английском языке и нажмите кнопку «Generate 4s» (сгенерировать четырëхсекундное видео).
Наблюдения
Видео генерировалось около двух минут — ролики создавали с помощью текстовых запросов на русском и английском языках. Все видео сохраняются в аккаунте, и скачать их можно в формате MP4.
Запроса на русском языке нейросеть не поняла — вместо озера Байкал получился автомобиль. Лучше всего у Gen-2 вышло сгенерировать пейзаж. С изображением людей дела обстоят не очень — черты лица капитана Джека Воробья меняются в движении. Не исключено, что модель Gen-3 Alpha лучше справится с этим запросом.
Результаты
Плюсы
- Хорошо работает с разными стилями.
- Доступна без VPN.
Минусы
- Не очень хорошо справляется с генерацией персонажей — черты лица меняются в движении, не исключено, что эту проблему решат более подробные промты и модель Gen-3 Alpha.
- Не понимает промты на русском языке.
- Нельзя оплатить подписку с российской карты.
Genmo AI
Сервис Genmo AI — проект исследовательской и производственной компании Latent Culture, которая базируется в университете Чикаго.
Что умеет
- Генерировать анимированные и 3D-картинки.
- Создавать элементы для дизайна и видеролики.
Бесплатная версия
Можно создавать до 100 единиц контента в день.
Платная версия
Подписка Turbo стоит 10 долларов в месяц:
- до 1000 единиц контента в день;
- нет водяных знаков;
- приоритетный доступ к новым AI-моделям, как только они появятся;
- работает без VPN.
Языки
Интерфейс на английском языке, нейросеть понимает запросы на русском.
Как использовать
- Зарегистрируйтесь на сайте — сервис работает без VPN.
- В окошке «Describe your video» введите текстовое описание на английском или русском языке.
- Нажмите кнопку «Submit».
Наблюдения
На генерацию видео ушло около двух минут — ролики создавали с помощью текстовых запросов на русском и английском языках. Видео сохраняются в аккаунте, и их можно скачать в формате MP4.
Одинаково неплохо получились и пейзаж, и персонаж. В отличие от видео в Runway, сервис понимает запросы на русском языке, а черты лица Джека Воробья не меняются в движении. Однако по видео непонятно, находится капитан в Санкт-Петербурге или нет.
Результаты
Плюсы
- До 100 единиц контента в день бесплатно.
- При определëнных настройках длительность видео увеличивается до 12 секунд.
- Хорошо понимает запросы на русском и английском языках.
- Работает без VPN.
Минусы
- Длительность уже созданного видео изменить нельзя — необходимо заново вводить запрос.
- Нельзя редактировать созданное видео.
- Нельзя оплатить подписку с российской карты.
Kandinsky
Kandinsky — hоссийская нейросеть от «Сбера». Первую версию сервиса презентовали осенью 2021 года — с еë помощью генерировали изображения. В октябре 2023-го появилась опция создавать и видео. Сегодня пользователям доступны обновлëнные версии:
- 3.1 — для генерации изображений;
- Kandinsky Video — для генерации роликов.
Что умеет
С помощью текстовых промтов генерирует изображения, микширует их, обрабатывает и создаëт четырëхсекундные ролики.
Бесплатная версия
Нет ограничений.
Платная версия
Сервис полностью бесплатный.
Языки
Интерфейс на русском языке, понимает запросы на русском и английском языках.
Как использовать
- Зарегистрируйтесь на сайте — сервис работает без VPN.
- Выберите модель «Видео» и введите текстовый запрос.
- Нажмите кнопку «Создать видео».
Наблюдения
Генерация видео занимает около 3–4 минут. Одинаково хорошо сервис понимает запросы на русском и английском языках. Все видео сохраняются в профиле, скачать их можно в формате MP4.
По сравнению с Runway и Genmo AI капитан Джек Воробей получился менее реалистичным и с более искажëнными чертами лица. С пейзажем платформа справилась неплохо.
Результаты
Плюсы
- Бесплатный сервис, нет ограничений.
- Понимает запросы на разных языках.
- Интерфейс на русском языке.
- Работает без VPN.
Недостатки
- Персонажи скорее анимированные, нежели реалистичные.
- Нельзя автоматически привязать аккаунт Google.
Подробный гайд по нейросети:
Pika
Pika Labs — стартап из Кремниевой долины, который исследует искусственный интеллект. Нейросеть Pika 1.0 команда анонсировала осенью 2023 года.
Что умеет
Нейросеть генерирует видео по тексту, фото и видео.
Бесплатная версия
Бесплатно доступны 250 начальных кредитов в месяц — 10 кредитов за трëхсекундное видео.
Платная версия
В платных версиях нет водяных знаков. Доступны три пакета месячной подписки — Standard, Unlimited, Pro за 8, 28 и 58 долларов соответственно. Между собой различаются опциями:
- увеличиваются скорость генерации и длительность видео;
- повышается разрешение;
- увеличивается количество кредитов.
У версии Pro неограниченное количество кредитов и приоритетный доступ к новым функциям.
Языки
Интерфейс на английском языке, понимает запросы на русском.
Как использовать
- Зарегистрируйтесь на сайте — сервис работает без VPN.
- Введите текстовый запрос на английском или русском языке в окошке «Describe your story».
- Нажмите кнопку со звëздочкой.
Наблюдения
Генерация видео заняла около трëх минут. Сервис отлично понимает запросы на английском и русском языках. Все видео сохраняются в аккаунте, и скачать их можно в формате MP4.
Черты лица капитана Джека Воробья не исказились в движении, но вряд ли персонаж находится в Санкт-Петербурге — на заднем фоне видны пальмы. Пейзаж получился не столь красочным, как у Runway и Genmo AI.
Результаты
Плюсы
- Работает без VPN.
- Понимает запросы на русском языке.
Минусы
- Нет оплаты российской картой.
Как правильно составлять промпты
Для удачного ТЗ важны:
- Четкость и конкретика. Опишите сцену детально, используя маркеры вроде businessman walking, city street, daylight, чтобы указать ключевые элементы — фон, освещение, действия. Например: вместо person on the street используйте businessman walking on a busy city street in daylight.
- Стиль и атмосфера. Уточните тон и атмосферу с помощью маркеров вроде mysterious, bright sunny day, cozy evening для создания нужного настроения.
- Длительность и темп. Если важно, укажите продолжительность сцен или скорость действий с помощью short clip, slow motion, quick pace.
- Анимация и движения. Для управления динамикой сцены упомяните конкретные движения, например, turns to camera, walks slowly и пр.
- Ключевые слова. Нейросеть поймёт задачу лучше с помощью конкретных слов и словосочетаний (например, corporate style, fantasy landscape).
Что советует видеомейкер Аля Сафонова
К первым нейросетям я отнеслась с осторожностью, но, экспериментируя с ними, поняла, что ИИ упрощает многие рутинные задачи. Поэтому делюсь лайфхаками:
- Это крутые помощники для тех, кто хочет экспериментировать и создавать контент для своих соцсетей. Не менее полезен он будет и профессионалам. Видеомейкеры могут упростить рабочие процессы и посвятить больше времени постпродакшену.
- Если вы не нашли подходящего ролика на стоках, то используйте нейросеть Runway или её аналоги — на генерацию видео от трëх до пяти секунд уйдëт около 2–3 минут. Но учтите, что видео от нейросетей не всегда выглядят естественно — могут искажаться черты лица и движения персонажей.
- Если нужен студийный звук, но нет профессионального микрофона и навыков обработки звука, используйте Adobe Podcast. Запишите звук на диктофон, но без сильного шума, а затем обработайте с помощью нейросети. ИИ уберëт небольшие шумы, эхо, и вы получите почти такой же результат, как в звукозаписывающей студии.
- Если в каком-то ролике услышали классный трек на фоне и не можете его найти для создания собственного видео, используйте Vocal Remover. Этот инструмент разделит вокал и минус.
- Если нужно скопировать тембр голоса из ролика и вы не хотите, чтобы озвучка была как у робота, используйте ElevanLabs. Там же найдëте шаблоны голосов хорошего качества.
- Снимать видео, настраивать камеру и свет я советую самостоятельно. Несмотря на то, что уже появился софт, который помогает расставлять свет в 3D-пространстве.
- Неважно, хотите ли вы создавать видео для себя или на заказ — советую не бояться искусственного интеллекта, а изучать его. Читайте обзоры, перенимайте опыт профессионалов, проходите курсы, знакомьтесь с новыми помощниками и внедряйте их в свою повседневную жизнь и работу».
самые лучшие на сегодня это клинг и лума, все остально такое себе, а ген вообще дороговато
клинг очень долго генерирует видео, иногда по несколько дней жду. И бывает, что слетает генерация вообще. Но мне тоже нравится Клинг, рисует вообще обалденно.
хотелось бы больше информации о точности генерации и возможных ограничениях каждой нейросети