Нейросеть от Captions для генерации видео с людьми по записи голоса — первые примеры из соцсетей

Пока модель Mirage доступна в закрытой бета-версии.

  • Пользователи в соцсетях начали делиться генерациями нейросети Mirage от разработчиков Captions — видеоредактора с ИИ-функциями. Она создаёт видео «эмоциональных» аватаров только по аудиозаписи голоса — «без референсных изображений».
Результаты генераций видео по аудиозаписи в Mirage. Источник: Angry Tom
  • Глава Captions и бывший исследователь в Google DeepMind Дрю Джегл показал примеры роликов, в которых нейросеть считала эмоции в голосе и подобрала внешность спикера по языку или акценту.
 Источник: Drew Jaegle
  • Однако в роликах видно, что изображение не всегда получается чётким, а некоторые пользователи пишут, что аватары выглядят, как «силикон, натянутый на каркас».
  • Компания анонсировала модель 25 февраля 2025 года. Её планируют сделать доступной для коммерческого использования «в ближайшие пару недель». Для тестирования нужно записаться в лист ожидания.
Судя по примерам, пока нейросеть генерирует видео длиной до двух секунд. Их можно продлить в других сервисах и синхронизировать движение губ с аудио. Источник: Robin Delta
  • Captions основали в 2021 году Гаурав Мисра и Дуайт Чёрчилл. В видеоредакторе есть функции создания субтитров и «нейродубляжа», в том числе на русском, а также генераторы ИИ-аватаров и видеорекламы.
  • В июле 2025 года стартап привлёк $60 млн от Index Ventures, Andreessen Horowitz, Sequoia Capital, Kleiner Perkins, Adobe Ventures, HubSpot Ventures и музыканта и актёра Джареда Лето при оценке в $500 млн.
55
14 комментариев

Путин звонил, сказал в вайтлист записался. Говорит влом уже 26 раз новогоднее обращение записывать.

5

Да можно старое пустить, никто не заметит подвоха. Это был тяжёлый год и далее по тексту

2

По нашим данным, он уже много лет использует подобные инструменты разработки советских ученых 80-х годов.

Две секунды? Да в пизду, даже тестить не буду.

3

Да, очень как-то жадно.

И снова новая технология от ИИ, которая является неоднозначной. С одной стороны - прикольно, с другой стороны - в неправильных руках может быть использовано в не самых хороших целях

1
Раскрывать всегда
Генератор видео Wan от Alibaba теперь можно протестировать в ИИ-сервисе Krea

Также добавили Veo от Google. Есть ограничения на число бесплатных генераций в день.

66
реклама
разместить
В открытом доступе появилась нейросеть для дубляжа LipDub — она может «заставить» героя видео говорить заданный текст

В 2024 году с её помощью Уилл Смит «заговорил» на португальском в рекламе Nomad.

2323
1313
33
В Kling AI добавили генерацию виртуальных моделей по текстовому запросу

Также обновили ИИ для создания изображений и видео.

1818
33
11

Мятное видео.

11
Революция в мире ИИ-видео: Mirage создаёт виртуальных людей, которые выглядят как настоящие

💡 Будущее уже здесь: виртуальные актёры без границ

11
Новый бесплатный генератор речи: революция в создании аудиоконтента

Искусственный интеллект продолжает ломать барьеры, и свежий релиз от разработчиков Sesame — это, без преувеличения, революция в области синтеза речи. Их новая открытая и бесплатная модель позволяет превратить текст в живую, реалистичную речь, сохраняя интонации и темп живого голоса.

22
Sesame выложила бесплатную модель синтеза речи своего «вирусного» ИИ-помощника — он смеётся, «заигрывает» и ведёт «искренний диалог»

Модель пока не поддерживает русский язык, в соцсетях её используют для практики разговорного английского.

77
11
Вышел ИИ генератор видео от Adobe

Generate Video – инструмент от конкурента Sora (OpenAI) позволяет любому создавать 5-секундные видео с разрешением 1080 p.

33
11
реклама
разместить
Видеогенераторы… Сегодня они такие! Превосходное качество от VEO2
11
OpenAI планирует добавить в ChatGPT генерацию видео от Sora
33
[]