Wan 2.5 против Veo 3: как китайская модель генерирует видео со звуком на русском языке

Нейросеть доступна бесплатно с российских IP-адресов.

Коллаж vc.ru
Коллаж vc.ru

Возможности Wan 2.5

  • Wan 2.5, которую Alibaba выпустила в конце сентября 2025 года, может генерировать видео на русском языке с нуля или по исходному кадру. В соцсетях её называют бесплатным аналогом Veo 3 от Google, которая доступна только по подпискам Pro и Ultra за $20 и $125 в месяц (1672 рубля и 10 тысяч рублей по курсу ЦБ на 28 сентября 2025 года).
  • Китайская модель поддерживает генерацию речи с разными «эмоциями», а также шёпотом — в стиле ASMR. Для простых видео с «говорящими головами» промпт можно написать на русском языке, добавить слова персонажа в кавычках и указать: использовать мужской голос или женский.

Запрос: Кот в студии подкастов говорит мужским глубоким голосом (на русском языке): «Я не понимаю, чё вы терпите эти абьюзивные отношения? Не готов встать ради вас ночью — всё, до свидания!»

Модель делает ошибки в ударениях. Приходится заменять некоторые слова на те, что она лучше «знает». Генерация vc.ru
  • Для более точных роликов с движениями промпт лучше написать на английском языке, а речь в кавычках — на русском.

Запрос: A young woman whispers in Russian: «Просто послушайте этот звук …». She then slowly raises her free hand to open the brightly colored energy drink can she is holding, deliberately showing it to the camera as the crisp, quiet fizzing sound of the drink opening resonates clearly. The camera starts with a close-up on her smiling face, capturing the warmth and softness in her expression, then smoothly transitions to focus on the can as it is opened, emphasizing the ASMR-style fizzing sound.

Модель поддерживает вертикальный формат. Изображение банки сгенерировали в Gemini, девушки — в Higgsfield Soul. Генерация Wan 2.5 через сервис Higgsfield. Генерация vc.ru
  • В отличие от Veo 3, в Wan можно не только сгенерировать звук, но и загрузить готовую аудиодорожку. Лучше всего синхронизация с движениями губ работает на китайском языке, на других может понадобиться несколько итераций.
Нужно нажать на значок звуковой волны
Нужно нажать на значок звуковой волны
Источник: Green Frog Labs
  • Доступная длина роликов — 5 и 10 секунд. Разрешение — 480р, 720р и 1080р. Для Veo 3 максимальная длина — 8 секунд, а максимальное разрешение — 4K.

Примеры и сравнение с Veo 3

Формат «вирусных» роликов, в которых персонажи ведут «блог» на русском языке.

Запрос: Rustic Cabin Selfie Tour: A woman clad in a heavy brown coat and a backpack gives a room tour in her wooden cabin, a small microphone attached to her attire. Holding her phone in selfie mode, she speaks casually to the viewer, alternating her gaze between the lens and the surroundings. The interior is sparsely decorated with pottery and weavings adorning the walls and shelves. Natural light filters through the window, illuminating the plank flooring and the log-built roof. She says (in Russian): «Ну хата как хата, все удобства на улице. Печью шибко не пользуемся.»

Результат Veo 3

Источник: YouTube-канал «Баба Яга»

Результат Wan 2.5

Модель неверно поставила ударение в слове «выписала». Генерация vc.ru по исходной картинке

Реклама продукта.

Выжимка из запроса: Apple watch ad. Begin with the brand logo floating in the center of a soft, gradient-lit void. The lighting subtly shifts, creating elegant metallic reflections on the logo surface, as if it's crafted from polished liquid metal. Without any cut, the camera smoothly moves closer. The logo starts to morph, its edges melt into flowing particles, like nanotech dust in zero gravity. These particles drift and reform continuously into the shape of the product, creating a seamless metamorphosis from logo to watch. The particles condense and materialize into the luxury watch. The watch gently rotates as it forms, now resting on a sleek, futuristic table made of brushed aluminum with frosted glass inlays. Without breaking the shot, the background subtly transitions. Minimalist architectural forms fade into view—curved white walls, floating light panels, and ambient reflections — creating a clean, futuristic showroom feel. The camera glides closer in one continuous move, focusing on the watch’s craftsmanship — macro shots of the crown, polished metal, seamless glass, and reflections, all captured in a single cinematic motion path. Ending: The camera gently pulls back, revealing the product.

Полный запрос — el.cine

Результат Veo 3

Источник: el.cine

Результат Wan 2.5

Генерация vc.ru

ASMR-ролики с «расслабляющим» звуком.

Запрос: Shot in extreme macro perspective, a flawless, crystal-clear, and detail-rich [glass blackberry] rests on a wooden cutting board bathed in warm lighting. The camera gently pushes and pulls, capturing the rainbow-like glimmers and prismatic refractions on the surface of the glass strawberry. The angle alternates between top-down and a 45-degree side view, freezing the moment the knife slices into the fragile [glass blackberry], revealing its intricate internal textures. Each slow, deliberate cut produces a crisp ting - the sound of glass shattering - followed by the soft clinking of tiny shards and the deep, resonant scrape of steel against wood. These sounds layer together to create a rich ASMR soundscape in an otherwise silent room. The overall pacing is slow and soothing, crafting a tranquil ASMR experience.

Результат Veo 3

Источник: Mia Taylor

Результат Wan 2.5

Модель воспроизвела звук, но не точно повторила «стеклянную» структуру. Генерация vc.ru по исходной картинке

Где и как пользоваться

  • Wan 2.5 доступна на сайте ИИ-сервиса Wan в том числе из России. Генерировать видео любой длины можно бесплатно, но ожидание не в приоритетной очереди может занять несколько часов. Чтобы ускорить генерацию, понадобятся кредиты.
  • За каждую авторизацию дают 10 бесплатных кредитов в день. Их можно копить. Чтобы продвинуться в очереди одно видео с разрешением 720р, уйдёт 10 кредитов, 1080р — 20 кредитов.
  • Подписка на сервис стоит от $6,5 в месяц (543 рубля).
Авторизоваться нужно по кнопке Check in
Авторизоваться нужно по кнопке Check in
  • Чтобы генерировать видео со звуком, нужно включить опцию Sound Effects.
  • Wan 2.5 также добавили в сервис Higgsfield. Там в день бесплатно можно создать три видео по 5 секунд или одно длиной 10 секунд — с водяным знаком. Подписка на сервис начинается от $9 в месяц (752 рублей).
  • Wan 2.5 можно пользоваться и через API. Стоимость — $0,14 за секунду видео в разрешении 1080р (около 11 рублей).
25
17
1
49 комментариев