Вы случайно не PHP Middle?

Mail.ru Group представила бесплатный сервис для создания виртуальных ведущих на основе ИИ Материал редакции

Инструмент позволит компаниям, медиа и блогерам быстро выпускать сюжеты студийного качества, говорят в компании.

В закладки
Слушать

Сервис «Смотри Mail.ru» разработал платформу с цифровыми ведущими для производства новостей и репортажей в телевизионном формате, сообщили vc.ru в компании.

Чтобы сделать новостной видеоролик, нужно загрузить текст (его прочитает ведущий) и, если необходимо, изображения, музыку, титры и ссылки. Пользователь может выбрать внешность диктора из предложенных вариантов и оформление студии (например, в цветах компании).

Речь и мимика ведущих реалистичны, утверждают в компании. Например, читая новости, они расставляют смысловые акценты и воспроизводят эмоции. Сервис бесплатный для пользователей.

Mail.ru Group

При создании платформы группа использовала собственные ИИ-разработки: над синтезом речи работала команда голосового помощника «Маруся», а в основе моделей ведущих лежит система компьютерного зрения группы Vision. Видеоизображение синхронизируется с речью ведущего — чтобы точно отображать движение губ и мимику, система обучалась на реальных людях и видеозаписях.

Mail.ru Group рассчитывает, что платформой будут пользоваться крупные компании, нишевые медиа и блогеры. Использование видеоредактора позволит им быстро выпускать сюжеты и экономить на производстве контента.

Видео от профессиональных медиаплощадок смогут попасть в рекомендательную систему сервиса «Смотри Mail.ru», что позволит пользователям заработать на видео, отмечают в компании. По прогнозам группы, к 2022 году 79% интернет-трафика в России будут составлять онлайн-видео.

Похожий сервис есть у «Сбербанка»: в апреле 2019 года компания представила виртуальную телеведущую с ИИ «Елена». Система позволяет создать ролик с новостным сюжетом, она генерирует речь и мимику.

{ "author_name": "Галина Мубаракшина", "author_type": "editor", "tags": ["\u043d\u043e\u0432\u043e\u0441\u0442\u044c","\u043d\u043e\u0432\u043e\u0441\u0442\u0438","mailrugroup"], "comments": 170, "likes": 79, "favorites": 221, "is_advertisement": false, "subsite_label": "media", "id": 141889, "is_wide": false, "is_ugc": false, "date": "Tue, 14 Jul 2020 11:01:28 +0300", "is_special": false }
Сервисы
Альтернативный квиз-конструктор для уменьшения стоимости лида
От сервиса умных виджетов OGNEMЁT для сайтов, которые призваны продавать.
Объявление на vc.ru
0
170 комментариев
Популярные
По порядку
Написать комментарий...
12

Сделал видос на dictor.mail.ru. Грузится уже 2 часа. 
Не могли подумать о серверных мощностях, раз запускают такой хайповый продукт.....

Ответить
4

У меня на 99% сказали "что-то пошло не так" и предложили все по новой.

Ответить
2

Рука-лицо 🤦‍♂️

Ответить
2

Я попробовал еще раз, теперь генерация прошла быстро, предложили кучу правок и настроек, и все зависло на сохранении якобы готового ролика, на 74% провисел полчаса и опять "Что-то пошло не так".

Ответить
1

А теперь вообще застряло на 88% уже как полчаса и не двигается.
Позорщики!

Ответить
0

быстрей всего ты на латинице что-то добавил или нет?

Ответить
2

Нет, на русском. Но вообще какая разница? Если запускают сервис, всё должно работать с любым языком

Ответить
2

Жиза... Жду уже час

Ответить
6

Мерзкая карлица? 

Ответить
5

А где ведущие-мужики?

Ответить
87

Мало кто знает, что Киселёв тоже нейросеть. Только кремлёвская. Он был собран из лиц 1000 самых ауевших депутатов)

Ответить
4

Мало кто знает, что нейросеть обучалась не только на людях, а еще и на животных и насекомых.

Ответить
4

в основном на насекомых

Ответить
0

Червях, клопах и остальных кровососущих особей. Тут целая эволюция в этом смысле.

Ответить
0

Прям всех участников Воскресного вечера с Соловьевым перечислили

Ответить
1

Ой, далеко не всех. Там еще бал леших, бродней и прочие живности.

Ответить
0

Дрочишь на Киселева?

Ответить
0

Да, ему на лицо)

Ответить
69

Была у меня одна такая ведущая на десктопе где-то в 2000х. Кто помнит,...

Ответить
1

можно в динамике? 

Ответить
33
Ответить
7

ух, прям в точности, как сегодняшнее письмо о задержке зарплаты. спасибо. 

Ответить
0

До сих пор там трясёт булками

Ответить
0

в динамике только секс по телефону

Ответить
9

Чего ты врешь! На десятой винде до сих пор VirtualGirl не решился удалить!

Ответить
21

Я честно не представляю, для чего в мире победившего тиктока нужны эти унылые безэмоциональные говорящие головы...

Ответить
22

да куча применений за рамками развлечений же есть:
1) Видео с обзором продукта и новостей в B2B
2) Заменять ведущих в неавторских программах
3) Делать различные информационные видео и тп

Ответить
13

Ну есть, конечно. Если вас не интересует количество просмотров. Такая подача даже прогноз погоды утопит.
Мир меняется. Люди ценят эмоции.

Ответить
11

Докрутят алгоритм по эмоциям, и будет выглядеть так что не отличить ее от реальной

Ответить
2

Вот тогда и посмотрим 😉

Ответить
1

- Скоро виртуальные ведущие вытеснят Соловьева и Киселева
- Вот тогда и посмотрим
- Вы уже здесь
- Соловьев и Киселев вещают среди миллиардов виртуальных слушателей

Ответить
0

Пусть сначала докрутят, чтобы это работало. 

Ответить
0

Так сейчас используют ведь, правда там голос более искусственный, для мемов больше подходит. Если расставить неправильные интонации, может и сойдёт.

Ответить
2

Зашел за этой картинкой.

Ответить
0

Для ньюфагов - Deus Ex

Ответить
24

Бля, да этим диктором можно заменить всех региональных ведущих новостей :) Кстати, никто не в курсе, почему даже самые зассанные блогеры снимают видосы лучше чем региональные каналы?

Ответить
10

У Наливкина передача хорошая!

Ответить
4

Потому что ведущие на региональные каналы попадают через постель/связи, а никак не за профессиональные качества. Простите за очевидные вещи :) 

Ответить
3

Причем тут ведущие. Я говорю про техническую сторону: качество картинки, монтаж, операторская работа. Да и не сравниваю я с федеральными каналами, а с блогерами, которым вчера 14 лет исполнилось. У них там либо афтреэффект сильно дороже стоит либо там реально всем поебать.

Ответить
–3

Бля, да этим диктором можно заменить всех региональных ведущих новостей

 Причем тут ведущие

Ок, бумер

Ответить
2

Дизить рандомные комменты в отместку - моветон

Ответить
0

Что значит "лучше"? Матерятся в кадре больше, или больше упоротой пурги гонят?

Ответить
2

Я не про контент, а про качество картинки, съемок и монтажа.

Ответить
2

Потому что работают на себя, да ещё и конкуренция огромная? Что поимеет работник традиционного ТВ, если предложит увеличить качество? Головную боль или увольнение.

Ответить
0

Пожалуй, ты прав. Пища для размышления

Ответить
0

По-твоему, "монтаж" - это всякие прибамбасы прикольные? Ты это имеешь ввиду?
Объясни.

Ответить
0

Потому что рекламируют рейд.

Ответить
21

попробовал создать видео - написал короткий текст. Оно генерировалось под 40 минут, в итоге - девушка на видео (она снята на видео, не 3д модель) читает какой-то рандомный текст, который совсем не совпадает со звуком. Сам же текст, произносится примерно как гугл-переводчиком. 
Короче, это стоковое видео с девушкой, которая что-то говорит, шевелит губами, но разобрать невозможно, при этом с текстом движения не совпадают, и на это видео наложен звук машинного голоса, читающего ваш текст.

Ну хз.

Ответить
11

Все так, выглядит паршиво и неестественно. 

Ответить
0

В качестве прототипов ведущих были взяты реальные люди, а вот их речь и мимика генерируются с помощью нейронных сетей.

Ответить
6

Цитата из ролика: "Кстати, все ведущие проекта созданы с помощью нейронных сетей"
Теперь звучит как false advertising.

Ответить
5

То есть это не вы виноваты?

Ответить
2

Мимика - ладно, но речь просто ужасна. Знаки препинания и пробелы расставлены, а некоторые слова всё равно почти слитно читает.
И всё это - при ужаснейшей скорости работы. 
Впрочем, не шибко удивлён качеству: техподдержка, отвечающая от месяца и более; почта с тормозящим интерфейсом без выбора облегчённой версии; целые проекты, закрывающиеся из-за одного диванного взломщика - список можно продолжать бесконечно.

З.Ы.: титры бегущей строкой когда завезёте, чтоб не нужно было вставлять в видео десяток статичных сменяемых кусочков текста?

Ответить
1

Ребята а почему нельзя загрузить ваши видео в вк?

Ответить
0

такая же балада(((

Ответить
0

не лукавьте, не мимика, а врезка фрагментов, где девушка делает паузу. И, видимо, бесшовная врезка пауз между словами. При этом, по звуку фраза окончилась, а девушка еще продолжает шевелить губами. Расхождение небольшое, но заметное. 

Мимика не имеет отношения к звуку.
Выглядит, как синхроперевод в фильмах.

Ответить
20

Че то губы не совпадают со звуком. Ощущение как будто кто то говорит за кадром. 

Ответить
4

Вы очень наблюдательны )) Можно вас тестировщиком нанять?

Ответить
17

Все ведущие сгенерированы.

Яндекс по поиску картинки нашёл актрису Тамару Мильгром. У меня распознавание лиц людей устроено плохо в мозгу. Похожи?

Ответить
5

Похожи.

Ответить
5

@Редакция vc.ru может спросите её, участвовала ли она в съёмках? Расширите пресс кит мэйлу.ру, немного журналистики?

Ответить
11

Привет! Всё так, Тамара Мильгром участвовала в проекте

Ответить
5

Какая боль.

На ролике в 0:28 "все ведущие проекта созданы с помощью нейтронных сетей".

Просто боль-боль.

Ответить
0

Не боль-боль, а не имеющие аналогов технологии. 

Ответить
3

блять, это не нейронка, это записи реальных актеров сука

Ответить
0

именно так)

Ответить
7

совпадение рота со звуком планируется? :D

Ответить
21

пока людей интересует "совпадение рота", видимо нет.

Ответить
9

Как в том анекдоте про прапорщика
- Ну знач был как-то у меня один Х в роте...
- Не в роте, а во рту

Ответить
0

- сегодня будем грузить люминий!
- товарищ старшина, не люминий, а алюминий
- кто сказал, выйти из строя
двое вышли
- так вот, все сейчас пойдут грузить люминий, а самые умные - чугуний!

Ответить
1

ИИ там конечно не нужен. Давно такая, технология была, чтобы анимационных и не только персонажей озвучивать и рот соответствующе открывался.

Ответить
26

Щас все, сложнее if-then-else считают ИИ

Ответить
4

Соловьёву всё?)))) Зачем платить больше )))

Ответить
11

Ну не, ИИ такой уровень говноэмоций не вытянет

Ответить
4

Сперва зоопарк его экспертов по всем наукам нужно обучить. Ответы mail.Ru подойдут идеально, я думаю, они там и черпают вдохновение.

Ответить
6

А где ссылка то?

Ответить
2

Как выяснилось, нужна почта@mail.ru. Впрочем, не удивительно.

Ответить
0

с гугловой сработало

Ответить
0

А ссылка вот: https://dictor.mail.ru/

Ответить
0

Ребята, а есть ограничение по тексту на входе или по длине видео на выходе? 

Ответить
0

Сейчас максимально возможный объём текста — 1 000 символов. Длина видео при этом может доходить до 90 секунд.

Ответить
4

Только что заходил - ограничение 500 символов, в которые влезает две с половиной очень коротких заметки или одна просто небольшая.
Это такой маркетинг у вас - заявлять бОльшие возможности, чем есть?)

Ответить
0

спасибо 

Ответить
0

Вещь полезная для нашего регионального СМИ, когда можно ожидать API? и возможность смены фона? 

Ответить
1

Денис, API у нас в планах, точную дату запуска пока назвать не можем. Опция смены фона появится в самое ближайшее время.

Ответить
0

почему вк залить нельзя??

Ответить
3

Выглядит прикольно. Не понятно зачем? Зафигачить технологию, а потом думать, как ее продать. Так же не понятно, каким образом данный сервис соотносится со стратегией компании "В центре нашей экосистемы — человек и его потребности."

Ответить
3

Ну, допустим, я — маленькое региональное СМИ. И я вижу, что у аудитории есть потребность смотреть видео. Я могу использовать этот продукт,  чтобы делать итоговый выпуск новостей каждый день. Это и есть решение моих потребностей.

Ответить
7

Странно сначала сделать сервис, а потом придумывать несуществующие кейсы кому это нужно. Мол, в какой-нибудь деревне ИИ будет медленно читать локальные новости...

Ответить
1

Вообще-то сначала делают сервисы исходя из предполагаемых потребностей и рынка, а потом появляются кейсы использования продукта. Всё логично.

Ответить
1

Так, почаще говорите это инвесторам!!! А то они ни чего не понимают, требуют какую то MVP, трекшен, продажи..

Ответить
0

Вы, наверное, меня с кем-то перепутали.

Ответить
0

ага.. .только в Майл. ру :-)

Ответить
0

Кстати, 70% аудитории слушает видео, а не смотрит.
Именно поэтому ютуб врубил подписку, одна из опций которой активный звук при выключенном экране телефона.

Ответить
0

Это уже подкасты🤷🏻‍♂️ Но новости это чаще сюжет с видеорядом (дтп, открытие какой-нибудь птицефабрики и т.д.), который нужно смотреть, чтобы иметь представление о происходящем.

Ответить
1

Кроме прочего, мейлу важно показать: "наш RnD живой", чтобы привлекать в команду исследователей. Рынок этот очень перегрет, крупных игроков с деньгами много (X5, sumsung, huawei, MTS...). GAN-ами единицы всерьез занимаются, так что такие публикации качают рынок.

Ответить
0

По Маслоу? Секс-услуги тоже будут? Еда-то уже есть.

Ответить
1

Гораздо интереснее было бы по смыслу из текста выделять сущности, по которым потом происходил бы поиск картинок или видео и все это собиралось в видел поток. Тогда новостные каналы не запаривались бы над монтажом (они и щас не запариваются, а просто вставляют всякие картинки)

Ответить
0

А ну ещё можно было бы переобучить модель диктора на свой фейс, но видимо у мейла проблемы с качеством в этом направлении(ну как и у всех)

Ответить
0

В прошлом году появилось уже несколько вариантов, вроде этот самый качественный (там ссылка на GitHub и на Collab):

https://youtu.be/u-0cQ-grXBQ

Ответить
0

Да понятно что есть уже, вопрос в нормальной коммерческой реализации.

Ответить
0

Думаете? Мне казалось, как раз коммерческие реализации есть, цифровые копии актёров успешно используются.

А было бы здорово соединить deepfake с какой-нибудь генерацией голоса вроде https://github.com/CorentinJ/Real-Time-Voice-Cloning и сделать свой фанфик по ГИБ или ГПМРМ с оригинальными актёрами.

Ответить
2

Ну я имею ввиду сервиса с широким набором услуг, для казуальных потребителей, пока нету.
Мэйл молодцы, то что открывают рынок, но вопрос только в качестве реализации и наборе сервисов, которые они дотянут до прода.

Ответить
2

Скама в ютубе будет от арбитражников...

Ответить
2

Теперь унылые ролики с фоткой и закадровым робоголосом на youtube станут унылыми роликами с унылыми робоведущими с унылыми голосами. Все.

Я бы добавил мультяшных персонажей и голосов нормальных.

Ответить
1

Не понимаю, зачем такое делать не в 3D-модели

Ответить
1

Особенно, учитывая, что они уже хорошего качества
https://replika.ai

Ответить
0

Комментарии в гуглплей - топ

Ответить
1

нужно загрузить текст и, если необходимо, изображения, музыку, титры и ссылки.

Всё это тоже можно нагенерировать нейросетью.

Ответить
1

Три часа пытался создать видео - все закончилось фразой "Что-то пошло не так"

Ответить
1

и все тот же ужасный голос, от которого прям мороз по коже

Ответить
1

Прикольно! Но хуево! Девушки - это просто записи, а нейронка? читает текст. Я то думал дикторы это модели генерируемые нейронкой, а это сука записи. 

Ответить
1

Идея - 5, исполнение - 2!

Ответить
0

100%! Вероятнее всего, скоро как из рога изобилия еще полетят страйки от мейлов на ютуб каналы, которое это чудо использовали. "За нарушение авторских прав"

Ответить
0

Ну что, все поигрались? Я - да.
И что? Да, собственно, и всё :) 

Покажите мне реальные СМИ, кто на полном серьёзе будет это использовать...

Ответить
2

мы используем роботоголос уже несколько месяцев в этом продукте https://youtu.be/Gdjen87sQD8
если заявляемые мейлом фичи будут реально работать, то это расширит возможности.

Ответить
0

Если бы у мейла было качество как у вас в ролике, было бы уже очень круто! 

Ответить
0

Напомнило Хлою из Detroit: Become Human

Ответить
1

Лицо скрывающее боль

Ответить
0

На первый канал таких клоунов поставьте

Ответить
0

Сайт с этим диктором не открывается.

Вообще странно, зачем тогда всякие манагеры снимают какие то родики, заменили бы их в видео ИИ)

Ответить
0

Сайт нифига не работает

Ответить
0

А где сервисом воспользоваться то?

Ответить
0

Михаил, перейти к сервису можно по этой ссылке: https://dictor.mail.ru/.

Ответить
0

А где ссылка на платформу?

Ответить
0

Платформа здесь: https://dictor.mail.ru/.

Ответить
0

Бля, как же страшно это выглядит! 

Ответить
0

А ведущего аналитика могут сделать?

Ответить
0

Виртуальный Киселев. Инновации которые мы заслужили. 

Ответить
0

Прикольная тема

Ответить
0

Изложение информации и декольте — вещи не совместимые

Ответить
0

Привет, deus ex

Ответить
0

deu sex

Ответить
0

Дай секс

Ответить
0

Это она скорее всего. Там походу на основе виде, не 3д

Ответить
0

Т.е. технологии 1 го канала решили продавать.

Ответить
0

Уже скоро плоскоземельщики и антипрививочники с новыми теориями заговора на экранах социальных сетей и мессенджеров. Спасибо Mail.ru.

Ответить
0

Дешёвого - да, качественного - в ряд ли

Ответить
0

В какой ряд?

Ответить
0

@Valera Popov смотри, твои наработки уводят!

Ответить
0

Все зависло на 17% с ошибкой «что-то пошло не так». Решил посмотреть готовые ролики, пока сервис вернётся в рабочее состояние. На главной странице сервиса есть ролики с виртуальным диктором, это треш. Девушка шевелит губами абсолютно рандомно, голос из «Гугл переводчика», нельзя такое на главную выкладывать. С таким же успехом можно на рандомное видео с любым настоящим ведущим накладывать виртуальный голос, это даже быстрее будет.

Ответить
0

Жду, пока mail.ru накинут мощностей на этот сервис, чтобы создать выпуск с монологом Дугина о национализме. Смешно было бы посмотреть на то, как хрупкая девушка говорит роботизированным голосом о том, что переход к модерну был ошибкой и человечество идёт по ложному пути последние несколько столетий

Ответить
0

@Mail.ru Group Как нейросеть учиться? Точнее на чем? Можно ли как то давать нейросети фидбек, чтобы она понимала как улучшаться и т.д.?
И второй вопрос, на который вряд ли будет честный ответ, но все же, как долго будет проект поддерживаться и планируется ли развивать его? Или это просто пиар история?

Ответить