Новый китаец на рынке видео: вышел LongCat-Video с открытым исходным кодом

Компания Meituan, наиболее известная в сфере доставки еды, сначала запустила LongCat-Flash-Chat, о которой писал тут, а теперь выпустил свою моделя для создания видео.

Что может:

  • Из текста в видео
  • Из изображение в видео
  • Продолжение видео в одной модели

Подробнее:

  • Производительность преобразования текста и изображений в видео достигла уровня SOTA с открытым исходным кодом
  • Видео высокого качества продолжительностью в несколько минут: без смещения цветов/потери качества
  • Надежная базовая модель унифицированного многозадачного видео с открытым исходным кодом на основе DiT с параметрами 13.6B

Параметры 13.6B

  • Качество видео 720p / 30 кадров в секунду за считанные минуты
1 комментарий