{"id":14275,"url":"\/distributions\/14275\/click?bit=1&hash=bccbaeb320d3784aa2d1badbee38ca8d11406e8938daaca7e74be177682eb28b","title":"\u041d\u0430 \u0447\u0451\u043c \u0437\u0430\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u044e\u0442 \u043f\u0440\u043e\u0444\u0435\u0441\u0441\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u044b\u0435 \u043f\u0440\u043e\u0434\u0430\u0432\u0446\u044b \u0430\u0432\u0442\u043e?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"f72066c6-8459-501b-aea6-770cd3ac60a6"}

Mail.ru Group представила бесплатный сервис для создания виртуальных ведущих на основе ИИ Статьи редакции

Инструмент позволит компаниям, медиа и блогерам быстро выпускать сюжеты студийного качества, говорят в компании.

Сервис «Смотри Mail.ru» разработал платформу с цифровыми ведущими для производства новостей и репортажей в телевизионном формате, сообщили vc.ru в компании.

Чтобы сделать новостной видеоролик, нужно загрузить текст (его прочитает ведущий) и, если необходимо, изображения, музыку, титры и ссылки. Пользователь может выбрать внешность диктора из предложенных вариантов и оформление студии (например, в цветах компании).

Речь и мимика ведущих реалистичны, утверждают в компании. Например, читая новости, они расставляют смысловые акценты и воспроизводят эмоции. Сервис бесплатный для пользователей.

Mail.ru Group

При создании платформы группа использовала собственные ИИ-разработки: над синтезом речи работала команда голосового помощника «Маруся», а в основе моделей ведущих лежит система компьютерного зрения группы Vision. Видеоизображение синхронизируется с речью ведущего — чтобы точно отображать движение губ и мимику, система обучалась на реальных людях и видеозаписях.

Mail.ru Group рассчитывает, что платформой будут пользоваться крупные компании, нишевые медиа и блогеры. Использование видеоредактора позволит им быстро выпускать сюжеты и экономить на производстве контента.

Видео от профессиональных медиаплощадок смогут попасть в рекомендательную систему сервиса «Смотри Mail.ru», что позволит пользователям заработать на видео, отмечают в компании. По прогнозам группы, к 2022 году 79% интернет-трафика в России будут составлять онлайн-видео.

Похожий сервис есть у «Сбербанка»: в апреле 2019 года компания представила виртуальную телеведущую с ИИ «Елена». Система позволяет создать ролик с новостным сюжетом, она генерирует речь и мимику.

0
173 комментария
Написать комментарий...
Александр Кучеряев

Гораздо интереснее было бы по смыслу из текста выделять сущности, по которым потом происходил бы поиск картинок или видео и все это собиралось в видел поток. Тогда новостные каналы не запаривались бы над монтажом (они и щас не запариваются, а просто вставляют всякие картинки)

Ответить
Развернуть ветку
Александр Кучеряев

А ну ещё можно было бы переобучить модель диктора на свой фейс, но видимо у мейла проблемы с качеством в этом направлении(ну как и у всех)

Ответить
Развернуть ветку
Denis Bystruev

В прошлом году появилось уже несколько вариантов, вроде этот самый качественный (там ссылка на GitHub и на Collab):

https://youtu.be/u-0cQ-grXBQ

Ответить
Развернуть ветку
Александр Кучеряев

Да понятно что есть уже, вопрос в нормальной коммерческой реализации.

Ответить
Развернуть ветку
Denis Bystruev

Думаете? Мне казалось, как раз коммерческие реализации есть, цифровые копии актёров успешно используются.

А было бы здорово соединить deepfake с какой-нибудь генерацией голоса вроде https://github.com/CorentinJ/Real-Time-Voice-Cloning и сделать свой фанфик по ГИБ или ГПМРМ с оригинальными актёрами.

Ответить
Развернуть ветку
Александр Кучеряев

Ну я имею ввиду сервиса с широким набором услуг, для казуальных потребителей, пока нету.
Мэйл молодцы, то что открывают рынок, но вопрос только в качестве реализации и наборе сервисов, которые они дотянут до прода.

Ответить
Развернуть ветку
170 комментариев
Раскрывать всегда