Вышла новая модель LongCat-Video-Avatar: это модель для создания видео-аватаров, которая хорошо работает с аудио

По сравнению с прошлой версией InfiniteTalk, новая модель делает длинные видео более стабильными и реалистичными.

Что нового:

  • Модель основана на архитектуре LongCat-Video и умеет создавать видео по голосу и тексту, по голосу, тексту и изображению, а также продолжать уже существующее видео.
  • Модель с открытым исходным кодом показала один из лучших результатов по реализму: заняла 1-е место в тестах EvalTalker по «человечности» аватаров — как с одним, так и с несколькими людьми.
  • Хорошо справляется с длинными видео: качество картинки не портится со временем, а переходы между частями видео выглядят плавно.
  • Аватары сохраняют внешний вид и идентичность на протяжении всего видео, без заметных артефактов.
  • Поддерживает видео с несколькими персонажами и может генерировать ролики практически бесконечной длины.
1
Начать дискуссию