Mail.ru Group представила бесплатный сервис для создания виртуальных ведущих на основе ИИ Статьи редакции
Инструмент позволит компаниям, медиа и блогерам быстро выпускать сюжеты студийного качества, говорят в компании.
Сервис «Смотри Mail.ru» разработал платформу с цифровыми ведущими для производства новостей и репортажей в телевизионном формате, сообщили vc.ru в компании.
Чтобы сделать новостной видеоролик, нужно загрузить текст (его прочитает ведущий) и, если необходимо, изображения, музыку, титры и ссылки. Пользователь может выбрать внешность диктора из предложенных вариантов и оформление студии (например, в цветах компании).
Речь и мимика ведущих реалистичны, утверждают в компании. Например, читая новости, они расставляют смысловые акценты и воспроизводят эмоции. Сервис бесплатный для пользователей.
При создании платформы группа использовала собственные ИИ-разработки: над синтезом речи работала команда голосового помощника «Маруся», а в основе моделей ведущих лежит система компьютерного зрения группы Vision. Видеоизображение синхронизируется с речью ведущего — чтобы точно отображать движение губ и мимику, система обучалась на реальных людях и видеозаписях.
Mail.ru Group рассчитывает, что платформой будут пользоваться крупные компании, нишевые медиа и блогеры. Использование видеоредактора позволит им быстро выпускать сюжеты и экономить на производстве контента.
Видео от профессиональных медиаплощадок смогут попасть в рекомендательную систему сервиса «Смотри Mail.ru», что позволит пользователям заработать на видео, отмечают в компании. По прогнозам группы, к 2022 году 79% интернет-трафика в России будут составлять онлайн-видео.
Похожий сервис есть у «Сбербанка»: в апреле 2019 года компания представила виртуальную телеведущую с ИИ «Елена». Система позволяет создать ролик с новостным сюжетом, она генерирует речь и мимику.
Сделал видос на dictor.mail.ru. Грузится уже 2 часа.
Не могли подумать о серверных мощностях, раз запускают такой хайповый продукт.....
Мерзкая карлица?
А где ведущие-мужики?
Мало кто знает, что Киселёв тоже нейросеть. Только кремлёвская. Он был собран из лиц 1000 самых ауевших депутатов)
Мало кто знает, что нейросеть обучалась не только на людях, а еще и на животных и насекомых.
Дрочишь на Киселева?
Была у меня одна такая ведущая на десктопе где-то в 2000х. Кто помнит,...
можно в динамике?
Чего ты врешь! На десятой винде до сих пор VirtualGirl не решился удалить!
Я честно не представляю, для чего в мире победившего тиктока нужны эти унылые безэмоциональные говорящие головы...
да куча применений за рамками развлечений же есть:
1) Видео с обзором продукта и новостей в B2B
2) Заменять ведущих в неавторских программах
3) Делать различные информационные видео и тп
Так сейчас используют ведь, правда там голос более искусственный, для мемов больше подходит. Если расставить неправильные интонации, может и сойдёт.
Зашел за этой картинкой.
Для ньюфагов - Deus Ex
Бля, да этим диктором можно заменить всех региональных ведущих новостей :) Кстати, никто не в курсе, почему даже самые зассанные блогеры снимают видосы лучше чем региональные каналы?
У Наливкина передача хорошая!
Комментарий недоступен
Что значит "лучше"? Матерятся в кадре больше, или больше упоротой пурги гонят?
Потому что рекламируют рейд.
попробовал создать видео - написал короткий текст. Оно генерировалось под 40 минут, в итоге - девушка на видео (она снята на видео, не 3д модель) читает какой-то рандомный текст, который совсем не совпадает со звуком. Сам же текст, произносится примерно как гугл-переводчиком.
Короче, это стоковое видео с девушкой, которая что-то говорит, шевелит губами, но разобрать невозможно, при этом с текстом движения не совпадают, и на это видео наложен звук машинного голоса, читающего ваш текст.
Ну хз.
Все так, выглядит паршиво и неестественно.
В качестве прототипов ведущих были взяты реальные люди, а вот их речь и мимика генерируются с помощью нейронных сетей.
Че то губы не совпадают со звуком. Ощущение как будто кто то говорит за кадром.
Комментарий недоступен
Комментарий недоступен
Похожи.
блять, это не нейронка, это записи реальных актеров сука
совпадение рота со звуком планируется? :D
пока людей интересует "совпадение рота", видимо нет.
https://www.youtube.com/watch?v=NBg7WUZMVfo
ИИ там конечно не нужен. Давно такая, технология была, чтобы анимационных и не только персонажей озвучивать и рот соответствующе открывался.
Щас все, сложнее if-then-else считают ИИ
Соловьёву всё?)))) Зачем платить больше )))
Ну не, ИИ такой уровень говноэмоций не вытянет
Сперва зоопарк его экспертов по всем наукам нужно обучить. Ответы mail.Ru подойдут идеально, я думаю, они там и черпают вдохновение.
А где ссылка то?
https://dictor.mail.ru/
Но, по странному стечению обстоятельств, не открывается
А ссылка вот: https://dictor.mail.ru/.
https://dictor.mail.ru
Выглядит прикольно. Не понятно зачем? Зафигачить технологию, а потом думать, как ее продать. Так же не понятно, каким образом данный сервис соотносится со стратегией компании "В центре нашей экосистемы — человек и его потребности."
Комментарий недоступен
Кроме прочего, мейлу важно показать: "наш RnD живой", чтобы привлекать в команду исследователей. Рынок этот очень перегрет, крупных игроков с деньгами много (X5, sumsung, huawei, MTS...). GAN-ами единицы всерьез занимаются, так что такие публикации качают рынок.
По Маслоу? Секс-услуги тоже будут? Еда-то уже есть.
Гораздо интереснее было бы по смыслу из текста выделять сущности, по которым потом происходил бы поиск картинок или видео и все это собиралось в видел поток. Тогда новостные каналы не запаривались бы над монтажом (они и щас не запариваются, а просто вставляют всякие картинки)
А ну ещё можно было бы переобучить модель диктора на свой фейс, но видимо у мейла проблемы с качеством в этом направлении(ну как и у всех)
Скама в ютубе будет от арбитражников...
Теперь унылые ролики с фоткой и закадровым робоголосом на youtube станут унылыми роликами с унылыми робоведущими с унылыми голосами. Все.
Я бы добавил мультяшных персонажей и голосов нормальных.
Не понимаю, зачем такое делать не в 3D-модели
Особенно, учитывая, что они уже хорошего качества
https://replika.ai
Комментарий недоступен
Всё это тоже можно нагенерировать нейросетью.
Три часа пытался создать видео - все закончилось фразой "Что-то пошло не так"
и все тот же ужасный голос, от которого прям мороз по коже
Прикольно! Но хуево! Девушки - это просто записи, а нейронка? читает текст. Я то думал дикторы это модели генерируемые нейронкой, а это сука записи.
Идея - 5, исполнение - 2!
100%! Вероятнее всего, скоро как из рога изобилия еще полетят страйки от мейлов на ютуб каналы, которое это чудо использовали. "За нарушение авторских прав"
Ну что, все поигрались? Я - да.
И что? Да, собственно, и всё :)
Покажите мне реальные СМИ, кто на полном серьёзе будет это использовать...
мы используем роботоголос уже несколько месяцев в этом продукте https://youtu.be/Gdjen87sQD8
если заявляемые мейлом фичи будут реально работать, то это расширит возможности.
Напомнило Хлою из Detroit: Become Human
Комментарий недоступен
На первый канал таких клоунов поставьте
Сайт с этим диктором не открывается.
Вообще странно, зачем тогда всякие манагеры снимают какие то родики, заменили бы их в видео ИИ)
Сайт нифига не работает
А где сервисом воспользоваться то?
Михаил, перейти к сервису можно по этой ссылке: https://dictor.mail.ru/.
А где ссылка на платформу?
Платформа здесь: https://dictor.mail.ru/.
Бля, как же страшно это выглядит!
А ведущего аналитика могут сделать?
Виртуальный Киселев. Инновации которые мы заслужили.
Прикольная тема
Комментарий недоступен
Привет, deus ex
deu sex
Это она скорее всего. Там походу на основе виде, не 3д
Т.е. технологии 1 го канала решили продавать.
Уже скоро плоскоземельщики и антипрививочники с новыми теориями заговора на экранах социальных сетей и мессенджеров. Спасибо Mail.ru.
Дешёвого - да, качественного - в ряд ли
В какой ряд?
@Valera Popov смотри, твои наработки уводят!
Говно
Все зависло на 17% с ошибкой «что-то пошло не так». Решил посмотреть готовые ролики, пока сервис вернётся в рабочее состояние. На главной странице сервиса есть ролики с виртуальным диктором, это треш. Девушка шевелит губами абсолютно рандомно, голос из «Гугл переводчика», нельзя такое на главную выкладывать. С таким же успехом можно на рандомное видео с любым настоящим ведущим накладывать виртуальный голос, это даже быстрее будет.
Жду, пока mail.ru накинут мощностей на этот сервис, чтобы создать выпуск с монологом Дугина о национализме. Смешно было бы посмотреть на то, как хрупкая девушка говорит роботизированным голосом о том, что переход к модерну был ошибкой и человечество идёт по ложному пути последние несколько столетий
@VK Как нейросеть учиться? Точнее на чем? Можно ли как то давать нейросети фидбек, чтобы она понимала как улучшаться и т.д.?
И второй вопрос, на который вряд ли будет честный ответ, но все же, как долго будет проект поддерживаться и планируется ли развивать его? Или это просто пиар история?
При попытке загрузить в вк видео выдает ошибку.
И какой смысл, если нельзя загрузить никуда кроме Мейла?
Только публиковать нельзя))))))
вот пример))))))))))))))))))))
Мне кажется чувству женщин с маленькой грудью очень даже задеты такими дикторами.
Интересное наблюдение
Чтобы речь стала естественной, нужно чтобы нейронная сеть поняла что такое интонационные ритмы речи. Интонация речи профессиональных дикторов по структуре сильно похожа на классическую музыку. А сейчас у этой нейросети интонация повторяющаяся, однотипная от точки до точки. Нейросеть делает паузы после запятых, хотя в исскустве озвучивания зачастую запятые наоборот не выделяются паузой, а читаются слитно. Потому что пауза это сильный инструмент. Все что стоит перед паузой - усиливается. И когда нейросеть делает паузу в ненужных местах, она усиливает ненужные слова, и поэтому приоритет утекает с главных слов. И теряется весь смысл. Потому что в предложении может быть только одно главное слово.
Попробуйте не ставить запятые там где вы не хотите паузу.
А потом за мной приедут и пришьют статью о распространении фейков? Не пасеба, уж лучше deep fake
А рассинхрон - это тоже специальная разработка?
Вот это круто. Будущее наступает.
Только меня бесит, что у виртуальной ведущей пришпилен такой ужасный микрофон?
https://help.mail.ru/legal/terms/smotri/dictor/ua
Пункт пользовательского соглашения:
3.5. Пользователь не имеет права каким-либо образом изменять, копировать, стирать, сохранять, скачивать, распространять, публично демонстрировать, передавать, продавать, размещать и иным образом использовать Контент, размещенный на Сервисе.
—-
То есть, на Youtube заливать, получается, нельзя? Если да, то зачем они добавили сохранение видео в mp4?
Mail.ru Group Я могу сгенерировать ведущего и использовать в своем видео? Залить в контакт? Для некоммерческого использования? На Ютуб? Что значит Пункт пользовательского соглашения 3.5? Так и не увидел ответа.
Задумка хорошая, исполнение г о в но. Грузится эти несчастные 1.5 минуты ( максимум 500 слов, если что, можно) два часа, потом зависает, ошибка и вылетает. Все, что вы там намонтировали не сохраняется в черновиках. Нужно заново. Делаешь, два часа грузится и снова ошибка. Мне два раза было достаточно. Возможно, Кто-то победит этот говносервис.
Очень долго грузит — https://player-smotri.mail.ru/?brandsafety=1&manifestUrl=https%3A%2F%2Fhb.bizmrg.com%2Fpulsar-b2b%2Fpublic%2Fshare%2Fvideo%2F84d5152b-ccca-4415-ad4e-4ccb5ec4b25b%2Fplaylist.m3u8&pictureUrl=https%3A%2F%2Fhb.bizmrg.com%2Fpulsar-b2b%2Fpublic%2Fshare%2Fvideo%2F84d5152b-ccca-4415-ad4e-4ccb5ec4b25b%2Fpreview.jpg&viewMode=external