Простая инструкция: как сгенерировать видео с вашим аватаром и вашим голосом доступными средствами ИИ

Вы можете превратить свою самую обычную фотографию в анимированного спикера, который говорит вашим голосом — без съёмок и видеомонтажа. Всё, что нужно — Gemini и платформа Wan Video.

Простая инструкция: как сгенерировать видео с вашим аватаром и вашим голосом доступными средствами ИИ

Пошаговая инструкция:

  1. Создайте профессиональное фото в Gemini: Зайдите на сайт gemini.google.com и загрузите своё фото и введите текстовый запрос, заполнив нужные места: "Give me a professional headshot of this person as a talking head, facing the camera, wearing [одежда], with [фон]. Close-up shot, professional lighting, high resolution."
  2. Создайте проект в Wan Video: Зайдите на create.wan.video, создайте новый проект, а в поле ввода промпта поменяйте тип медиафайла с "Video" на "Avatar".
  3. Добавьте изображение и голос: Загрузите сгенерированное изображение. Затем либо запишите 10–15 секунд своего голоса, либо вставьте текст до 300 слов и выберите один из встроенных голосов.
  4. Синхронизируйте речь и движения губ: Нажмите "Generate". На генерацию может потребоваться несколько минут.
  5. Скачайте готовое видео: После генерации вы можете экспортировать видео и использовать его для презентаций, соцсетей, лендингов и любых других задач.

Советы:

  • Напишите текст заранее и разбейте его на короткие фразы с паузами. Это сделает речь более плавной.
  • Лучше выбрать нейтральное выражение лица и прямой взгляд в камеру.
  • Если делаете несколько фрагментов, старайтесь сохранить визуальную целостность: один фон, один свет, одна поза.

Платформа позволяет создать до двух видео одновременно без приобретения платного тарифа. Если нужно больше, потребуется использовать систему кредитов.

Для генерации видео в высоком разрешении или длительностью свыше 2 минут, скорее всего потребуется платный тариф — подробности указаны внутри самого сервиса.

Начать дискуссию