Модель генерирует видео длительностью до 5 секунд с разрешением 544p и 720p. В качестве промптов служит текст на английском и китайском языках; западные обзорщики отмечают, что нейросеть от Tencent справляется с английскими запросами чуть хуже, чем аналоги, например, Runway Gen-3. При этом видео получаются ничуть не хуже: HunyuanVideo создаёт сцены с разнообразными объектами и текстурами, реалистичным движением и освещением.
Не сказал бы, что движения реалистичные, особенно по первой генерации. Есть и получше, поэтому насчет "превосходит конкурентов" я бы поспорил. С остальными вроде неплохо, качество довольно хорошее
Никогда бы не подумал, что для таких технологий понадобится так много вычислительных мощностей. Надеюсь, что в будущем нейросети с такими требованиями будут намного доступнее
Ну вообще, по сравнению с другими ии, которые я встречал, этот очень даже неплох. Но уверен и в нем есть ошибки, и где-то уж точно появится "второй плавник")
Скоро любой сможет создать свой маленький фильм, просто написав пару предложений)) Представляю, какие прикольные видео можно будет сделать.