Трибуна
Retell
1861

Retell: как мы озвучили 40 тысяч статей онлайн-СМИ

Привет! Я — Сергей Баранов, со-основатель сервиса Retell. И я не хочу, чтобы вы читали эту статью. Почему? Потому что её можно слушать!

В закладки
Аудитория Sports.ru слушает статьи через наш сервис

С чего всё началось

В конце 2018 года мы обратили внимание на нарастающий тренд, связанный с аудио на сайтах интернет-изданий по всему миру. Тогда этот формат потребления контента был крайне экспериментальным: то появлялся на сайтах, то пропадал.

Для себя мы отметили, что все найденные нами издания с аудиоверсиями своих публикаций реализовывали это по-разному. Часть из них ушли в разработку собственных программных решений, другая часть использовала сторонние плагины, такие как Amazon Polly для WordPress, а были еще и такие издания, кто вручную озвучивал тексты через демо-стенды Text-to-Speech-платформ и также вручную размещал файлы со сгенерированным аудио внутри своих материалов.

Последний вариант — это та ещё рутина. Ради эксперимента попробуйте измерить время создания хотя бы одной статьи, например, через демо-стенд «Яндекс Speechkit». Для корректности прибавьте еще несколько минут на размещение получившегося аудио на самом сайте.

Измерили? А теперь представьте, что вы публикуете от 20 до 100 статей ежедневно. На долго ли вас хватит?

«Тут нужна автоматизация», — подумали мы и создали MVP нашего сервиса. Первая версия включала в себя:

  • Виджет-плеер для прослушивания аудио на сайте.
  • Подключение через внедрение в статьи специальной микроразметки.
  • Один «дикторский» голос.
  • Хранение аудио на наших серверах без возможности скачивания и размещения на сторонних площадках.
  • Вебхук для создания собственного навыка для «Яндекс.Алисы».
  • Старт сотрудничества после подписания двустороннего договора, с оплатой по счету.

Не путайте, Retell — это не платформа Text-to-Speech, конкурирующая с TTS от корпораций, а сервис для онлайн-изданий, позволяющий в автоматическом режиме озвучивать статьи и публиковать созданные на их основе подкасты.

Создание продукта

Блок с преимуществами на созданном лендинге

Несмотря на не слишком богатую функциональную «начинку» MVP, мы сразу же запустили простенький лендинг и разместили несколько рекламных постов, чтобы оценить спрос и собрать обратную связь.

В первую же неделю через лендинг мы собрали более 20, а всего с момента запуска более 200, заявок и стали общаться с изданиями с целью понимания их потребностей и фреймворка принятия решения о подключении к нашему сервису.

В процессе общения мы обнаружили много проблем прошлой концепции и решили:

  • Отказаться от внедрения сложной микроразметки статей в пользу подключения по ссылке на RSS-канал и упростить процесс подключения, в целом.
  • Добавить личный кабинет издания, где отображать собираемую статистику по прослушиванию статей.
  • В этом же ЛК позволять: выбирать голос, гибко управлять тарифом и производить оплату, как картой, так и через самостоятельное формирование счета.
  • Реализовать механизм создания плейлистов и подборок аудиостатей.
  • Для каждого отдельного сайта дать возможность создания собственного словаря правильного произношения фамилий, названий, аббревиатур, сокращений.
  • Поддерживать работу сервиса в мобильных приложениях и на AMP-страницах.
  • Снизить стоимость сервиса.

Становясь лучше

Полученная от изданий информация дала пищу для серьезных размышлений о пути развития сервиса, воплотившихся в следующие изменения:

Подключение

Подключиться теперь очень просто: указать ссылку на RSS, подтвердить права на сайт, разместить плеер на страницах сайта.

Личный кабинет

Релиз личного кабинета издания также не заставил себя долго ждать, и многие «полезности» увидели свет. Среди них есть настройка голоса озвучивания, добавление виджета мобильной версии, гибкая настройка тарифа и оплата:

Стали собирать и отображать статистику прослушивания статей, но не просто общее количество, а с разбивкой по точкам контакта с аудиторией.

Словарь

Добавили и словарь, который помогает изданиям управлять ударениями в сложных для озвучивания случаях.

И это далеко не полный список того, что уже есть в нашем сервисе, не говоря о том, что несколько потрясающих и крайне полезных для изданий функций находятся в стадии активной разработки прямо сейчас. Но пока обойдемся без спойлеров ;)

«Роли озвучивали»

Retell собрал в своем каталоге голосов более десяти отборных голосов от разных TTS-платформ. Вот несколько сэмплов:

Мы активно и постоянно мониторим рынок и при появлении новых качественных голосовых моделей сразу же добавляем их в свой каталог.

Не всё так просто

Во время испытания беты мы столкнулись с проблемой, связанной с турбо-страницами «Яндекса». Одному из наших первых клиентов пришло уведомление от «Яндекс.Вебмастера» о критической ошибке:

Дальнейшее общение со службой поддержки «Яндекса» не очень и помогло:

Адрес сайта и номер тикета умышленно изменены

В предложенном «Яндексом» варианте каждому изданию пришлось бы подключаться к нашему API для получения ссылки на звуковой файл и переписывать механизм формирования RSS для турбо-страниц. Что шло вразрез основной идее нашего сервиса, основанной на исключительной простоте добавления аудио.

Разумеется, мы спросили про возможность установки js-виджета в турбо-страницы, но «увы»:

По факту же эта проблема могла бы убить наш сервис, так как выбор, перед которыми были поставлены издания, был бы такой:

Озвучивание статей или турбо-страницы (и весь трафик с них).

Очевидно, что здесь выбор был бы не в нашу пользу, но у нас очень крутая команда и в ней есть волшебники. И исключительно за счет их магических чар мы смогли решить эту проблему и теперь все подключенные к Retell сайты могут не беспокоиться о блокировке их турбо-страниц.

Так что если вы решите делать своё техническое решение для озвучивания статей или воспользоваться альтернативным сервисом, знайте — ваши турбо-страницы могут забанить.

Что будет дальше

Мы активно заняты развитием Retell. В прошлом месяце мы тотально обновили ядро сервиса и переработали архитектуру для его более стабильной работы, снижения нагрузки и себестоимости.

За счёт этого мы смогли в несколько раз снизить стоимость сервиса, и теперь для всех новых клиентов активны новые, более дешевые тарифы. Конечно, про старых клиентов мы тоже не забыли и перевели их на выгодные тарифы автоматически.

41568
статей было озвучено через Retell (актуально на 24 июня 2020)

И сегодня мы делаем официальный и публичный запуск сервиса Retell. В числе early adopters нашего сервиса уже есть интернет-издания:

  • Sports.ru
  • Dni.ru
  • ProUfu.ru
  • SuperOmsk.ru
  • ProVladimir.ru
  • Avtocod.ru
  • Novostroy.ru

и с десяток других классных сайтов.

И если вы хотели бы попробовать аудиоформат применительно к вашей аудитории, будем рады видеть вас в числе наших клиентов, а если вы являетесь непосредственным потребителем-читателем, перешлите вашим любимым изданиям ссылку на наш сервис. Будем признательны!

Хотели бы, чтобы статьи на ваших любимых ресурсах были доступны в аудиоформате?
Да
Нет
Пф, они уже доступны в аудио
Показать результаты
Переголосовать
Проголосовать

P. S. А ещё, мы будем благодарны, если в комментариях к этой статье вы предложите свои идеи, как сделать Retell лучше как для конечных пользователей, так и для онлайн-изданий. Спасибо!

P. P. S Ого! Вы дочитали нашу статью до конца. В знак благодарности за ваш неподдельный интерес, держите специальный промокод на 30% скидку: VC.RU

{ "author_name": "Retell", "author_type": "self", "tags": ["\u0441\u0442\u0430\u0442\u044c\u0438","\u0430\u0443\u0434\u0438\u043e"], "comments": 69, "likes": 14, "favorites": 43, "is_advertisement": false, "subsite_label": "tribuna", "id": 133381, "is_wide": false, "is_ugc": true, "date": "Thu, 25 Jun 2020 10:26:46 +0300", "is_special": false }
Объявление на vc.ru
0
69 комментариев
Популярные
По порядку
Написать комментарий...
11

Беда, конечно, ну робот же...
Ту же Алису можно потерпеть при озвучении 5-10 сек., например, прогноза погоды. А слушать большой текст постоянно невозможно.

Основные проблемы:
- отсутствие динамики в голосе (интонационной и темповой)
- отсутствие смысловых и речевых пауз (как следствие "слепливание" слов)
- отсутствие смыслового подъема/опускания интонации, когда это необходимо
- неправильные ударения (к слову, вроде это вручную сейчас исправляют)

в итоге:
скучное, гундосенье на одной ноте и постоянное напряжение слушателя на распознавании текста.

Если провести аналогию с созданием виртуальных МУЗЫКАЛЬНЫХ инструментов, то нужны т.н. round-robin и layers, когда голос будет "плавать" по интонации и темпу, причем "правильно" плавать. Т.е. нейронная сетей должно быть 2, как минимум: та которая генерит голос и та, которая управляет интонацией относительно смысла текста (т.е. нужно распознавать ХОТЯ БЫ части предложений, вопрос/восклицательный знак, многоточие)

В общем удачи и успехов в этой нелегкой сфере!

Ответить
3

Олег, спасибо, очень ценное замечание.
Это именно тот подход, который мы используем. Две нейронные сети решают эту задачу гораздо эффективнее (+ ещё одна вспомогательная). Надеюсь удивить вас лично и наших клиентов результатами в ближайшее время, ведь наша система обучается и с каждым днём становится лучше. :)

Ответить
1

Надеюсь, что вы реализуете хотя бы паттерн т.н. дикторской "горки" в пределах длинного предложения или деепричастного оборота - т.е. начинаем снизу - идем к возвышению на 3/4 отрезка и идем вниз и так повторять и/или чередовать с прямыми отрезками, то просто на порядок изложение будет живее. Конечно, иногда, смысловые акценты будут проступать не совсем обоснованные, но это частности. Короче, свяжитесь с дикторским сообществом, там есть достаточно профессионалов, которые могут формализовать правила подъема/спуска, горок итд.

В частности, рекомендую 
ВИКТОРИЯ ВАСИЛЬЕВА, Доцент, кандидат филологических наук, Зам. председателя научной комиссии Института Высшей школы журналистики и массовых коммуникаций. Кафедра речевой коммуникации
https://jf.spbu.ru/rech/3817.html

У нее есть книги по теме.

P.S. Женские голоса в примере НАМНОГО лучше мужского, какие-то интонационные вещи слышны... главное, чтобы не оказалось потом, что это "живая" запись :)))

Ответить
0

Олег, со специалистами уже работаем. Спасибо за полезный контакт, изучим материалы и книги Виктории, возможно, что обратимся лично.

Голоса из примеров - это не запись, а самая что ни есть синтезированная речь. К тому же, в статье  показали только 3 примера. Всего же, у нас более 10 разных вариантов.

Ответить
2

Тогда это очень крутой пример. ИМХО: один из лучших, что я слушал у разных движков за последние 10 лет, поэтому и засомневался. Может так нейросеть карты разложила, надо смотреть на большом объеме вариантов, но, правда, звучит очень близко к "живью"!

Ответить
2

2016 год  - "количество учтенных слепых и слабовидящих в нашей стране составляет 218 тысяч человек, из них абсолютно слепых — 103 тысячи. Ежегодно в России число лиц впервые ставшими инвалидами из-за нарушения зрения составляет около 45 тысяч"

Это была присказка. Сама сказка у меня такая
- недавно я делал версию сайта для слабовидящих. Для этого я тестировал его через скринридер.

Вы не поверите, как плохо звучит скринридер по сравнению с этим роботом. Но судя по отчетам, тем, кому нужно читать - делают еще хуже, по нашим меркам. Они увеличивают скорость в несколько раз и слушают тексты на таком ускорении, на котором для нас все сливается.

Да, робот должен быть хорошим, как человек.

Но человек может слушать и плохого робота. Полировка качества голосовых роботов - это необходимая фишка для расширения аудитории, но ядру, кому надо слушать - это пофиг.

Качество голосовых роботов переоценено и высшая планка нужна для такого широкого аудитории, которая большую часть времени не будет ими пользоваться.

Ну еще банкам и прочим обзвонщикам - им, да, нужна имитация.

Ответить
2

У Вилсы есть видео, где у него гость слепой. Очень интересно рассказывал про это дело. Он там тоже показывал, как они на этой суперскорости ориентируются и вполне нормально, насколько это в целом можно, пользуются техникой

Ответить
3

Если вдруг, кому-то интересно и лень искать, то вот это видео https://www.youtube.com/watch?v=RQiN1Hhrxu0

Ответить
1

Супер! С вашей наводки мы нашли нужное видео, посмотрим и порефлексируем на этот счет. Спасибо, Влад!

Ответить
1

Блин, спасибо, а то я уже весь Хабр обрыл, мне казалось, что видео было там.

Да, именно это врезалось в память в первый раз - как человек ловко работает вслепую со смартфоном.

Я, зрячий, когда тестировал сайт на своем телефоне - был в шоке от непривычки работать не глядя

Ответить
0

Сергей, спасибо за интересные данные о слепых и слабовидящих в России. Наш сервис нацелен на повышение удобства при потреблении контента на сайтах СМИ. Особого фокуса на этой группе пользователей у нас нет. Может быть вы можете подсказать идеи, которые могли бы сделать наш сервис удобнее и доступнее для слепых и слабовидящих? например, настройка скорости прослушивания или что-то еще.

Ответить
1

Судя по всему, слепым и слабовидящим нужна скорость до 5x. А вообще, наверное есть какие-то сообщества, где они как-то общаются или есть их представители, надеюсь найдете. :)

Ответить
1

мне лично приятно слушать такой голос, без эмоций и спокойно

Ответить
0

Sabit, рады, что вам нравится. Как считаете функция настройки скорости речи была бы полезной? Может быть посоветуете что-то в плане развития сервиса, его функций?

Ответить
0

PS: вот тут есть пример, в центре статьи - видео с голосовым ассистентом на скорости 1000 слов в минуту

https://habr.com/ru/post/461469/

Ответить
0

Спасибо, Сергей. А что на счет идей и пожеланий?

Ответить
1

меня всё устроило, но денег не дам, я рядовой разработчик

но если таких статей будет больше - я только за. Я люблю слушать подкасты, залипая одновременно в игры вроде старой Цивилизации.

Ответить
0

Отлично, мы как раз нацелены на работу со сми и контент-проектами, что пользователи могли слушать интересный им контент.

Ваших денег мы и не просим, но было бы отлично, если бы вы проголосовали в опросе в конце статьи ;) Этого будет более чем достаточно.

Ответить
2

Первый голос очень нудный, а вот второй чертовски хорош, прям как живой. 

Ответить
1

У всех очень разное восприятие. К тому же, в статье у нас показаны примеры только 3-х голосов. Всего же издания могут выбрать из 11 голосовых моделей в своем личном кабинете, и мы стараемся увеличить этот выбор.

Ответить
1

Да, кстати, женские отличные, я слушал только мужской и очень монотонный. Но у женских какая-то явная проблема с качеством записи ("пыки" на взрывных "п", какие-то проглатывания).

Ответить
2

Даже не знал о таком сервисе... Какие языки еще поддерживаете?

Ответить
0

Рады, что статья оказалась полезной.  Сейчас в интерфейсе можно выбрать только русский язык. До конца лета добавим еще 22 языка, включая наиболее популярные.

Ответить
0

Языки интерфейса только или голосовые?

Ответить
1

На оба вопроса ответ - да. На сегодня: язык интерфейса - только русский, голоса - только русский. Очень активно работаем над мультиязычным интерфейсом, а голоса для других языков уже на подходе, вот-вот.

Ответить
0

Спасибо

Ответить
0

Большое пожелание: вести активную разработка русской модели, учет лингвистических особенностей и генерация максимального "живого" произношения! А так молодцы!

Ответить
0

Все пожелания обязательно учтем. Специально просили в статье давать обратную связь в комментариях - это очень важно для нас. Вам, Олег, отдельное спасибо!

Ответить
0

Тимур, а какие языки наиболее интересны и приоритетны для вас?

Ответить
2

Идея прикольная, надо будет потестить. Было бы круто если бы вы добавили интеграцию аудиоверсий с подкастами ВК, чтобы они автоматом выгружались.

Ответить
0

Андрей, отличная идея! Есть планы по интеграции не только лишь с подкастами Вконтакте, как минимум, есть еще Яндекс Подкасты https://music.yandex.ru/non-music

Ответить
1

Интересно, используете ли профессиональные плагины для согревания звука (аналоговая сатурация)? Очень нравится https://slatedigital.com/virtual-tape-machines/

Ответить
1

У нас есть постпродакшен, но именно такую штуку не используем. Обязательно присмотримся, огромное спасибо!

Ответить
0

Избавьтесь при записи фонем от взрывных "п". Это очень режет ухо. На пост продакшне HP-фильтром можно пофиксить. А вообще это на записи pop фильтром исправляется же. Вопрос также - можете создать кастомную речевую модель, сколько (порядок" фонем (или фраз)) пишется. сколько стоит?

Ответить
0

Добавление кастомных речевых моделей возможно. Разберем на примере голоса, обозначенного вами как "один из лучших, что вы слышали": для получения такого качества нам требуется около 8 часов записанной речи. По стоимости мы бы ориентировались от $100,000 до $500,000 за услугу «под ключ»

Ответить
1

Голос #2 огонь! #3 человечный и тёплый, но интонационные скачкИ неестественные. #1 ну обычный голос для ржак Бостон Дайнэмикс только чуть получше.

Ответить
1

Очень рады, что некоторые голоса из представленных примеров вам понравились. Оцените и другие, сейчас в нашем сервисе можно выбрать из более чем 10 отборных голосов, включая наиболее популярные у изданий (их в примерах не было)

Ответить
1

Зашёл на сайт, присматриваюсь. Но раз разработчик пока здесь - скажите, а сколько будет стоить сотрудничество с Вами для сайта, у которого примерно 30,000 старых статей и добавляется примерно по 10 в день. Средний объем статьи - примерно 6-7 тысяч символов. Спасибо! 

Ответить
1

Борис, для вашего сайта все новые статьи сможете озвучивать за 6 481,23 рублей в месяц с применением промокода VC.RU

30 тыс. статей - это, конечно, большой объем для единовременного озвучивания. Если посчитать, то для озвучивания всех старых статей потребуется порядка 900 тысяч рублей. У вас весь контент актуален в старых статьях?

В Retell не сложно определить актуальность и сильно сэкономить на текстах, не пользующихся спросом. Напишите нам hello@retell.cc

Ответить
1

Я вот чего не нашёл: озвучка загруженных текстов извне. Очень бы хотелось озвучить книги, аудиоверсий которых нет - для личного пользования. Обычные сервисы не подходят из-за того, что их голоса неестественны. А ваши прямо как живые.
Кстати, такой сервис подошёл бы и издательствам; стоимость озвучки живым спикером чертовски дорогая!

Ответить
1

Алекс, здорово, что вы об этом задумываетесь. Наш сервис как раз об этом. Заходите, попробуйте https://speechki.org 

Ответить
0

Для собственного пользования за 7000 рублей? Ну, видимо, это не мой сервис.

Ответить
1

Как раз сейчас хочу сделать телеграм канал для голосовых ответов на частые вопросы мам (поддержка грудного вскармливания, лактостаз и т.д.), но пока не вижу альтернативы живому голосу акушера. Теплота и интонация очень важна. Подожду пока вы реализуете все задумки.
Буду за вами следить 🤗

Ответить
0

Анна, это очень классный контент. Согласны, что интонация и теплота голоса в вашей тематике очень и очень важны. Мы постараемся добавить максимально подходящие голоса, с теплотой ;) А вы уже протестировали все голоса, доступные для озвучивания? Может быть какой-то из уже добавленных вам подойдет?

Ответить
1

@Retell Больше 5 000 000 симв. не купить?)

Ответить
0

Больше 5 млн символов купить можно, да хоть 100 млн., но чтобы это сделать нужно списаться с нами - мы и специальные, особо выгодные условия предложим ;)

Ответить
1

Очень хорошее качество озвучки. Вы сами разработали технологию или используете сторонние сервисы? Как я знаю разработка подобных технологий очень сложное и дорогое дело.

Ответить
0

Для синтеза речи мы используем Text-to-Speech решения от корпораций, но кроме того, что мы максимально упростили процесс подключения и позволяем получить озвучивание к сайту за несколько минут, мы также делаем результат их синтеза лучше за счёт подготовки и предварительной разметки текста для синтеза, а также постпродакшена.

Ответить
0

Послушал. Мне кажется голова даже заболела:)
Рановато ещё такому. Хотя 2020 год. В своё время думали что на гиперлетах уже будем передвигаться. А тут робот нормально текст прочитать не может :(

Ответить
1

Качество речи постоянно улучшается. Это происходит чрезвычайно быстро, и уверяем, что неотличимую от человеческой синтезированную речь вы услышите намного раньше, чем мы пересядем на гиперлеты ;) Так что вам нужно будет лишь немного подождать. Кстати, миллионы пользователей уже сейчас слушают такую озвучку и не испытывают никакого дискомфорта.

Ответить
1

С надеждой смотрим в будущее ))

Ответить
0

Друзья, если не сложно, накидайте еще критики, пожеланий и идей. 

Ответить
1

Вставка в спортс ру мой мозг воспринял как рекламу, не знаю почему, но выглядит как рекламная вставка. Вот такая критика. 

Ответить
0

Спасибо за фидбэк! Буквально вчера мы сделали релиз гибкой настройки внешнего вида нашего плеера. Возможно, когда наши клиенты произведут настройки под стиль своих ресурсов, он будет выглядеть намного нативнее.

Ответить
0

Скажите, а я смогу, после подключения вашей платформы, скачивать себе на комп полученные аудиофайлы? 

Ответить
0

Да, конечно. Вы, как издание, сможете скачать все озвученные статьи в своём личном кабинете.

Что касается читателей-слушателей, то возможность скачивать аудио с сайта подключенного издания пока что не даём. Как думаете, нужно ли это?

Ответить
1

Нет. Слушателям думаю нет. Еще вопросик. Скажите, а обратную услугу вы не хотите разработать? Траскрибацию по адекватной цене? Рынок гораздо больше. А инфраструктура у вас в принципе готова. Или она под обратный процесс не заточена?

Ответить
0

Заниматься транскрибацией пока не планировали, и под обратный процесс наш сервис, действительно, не заточен. Сейчас у нас фокус исключительно на онлайн-издания. Есть ли у них потребность в транскрибации?

Ответить
1

Довольно часто у серьезных онлайн изданий есть свой видео-продакшен. Например Форбс. Тот же VC. Они будут рады дополнить видео еще и текстуальным контентом. Текстовый контент - очень полезная штука для онлайн СМИ.

Ответить
0

Как вы решили вопрос хранения записей на сервере (ваш личный или арендуете) и в каком формате идут аудио?

Ответить
0

Изначально, это было большой проблемой, которую наши инженеры решали. В итоге, успешно решили, и сейчас мы используем несколько облачных сервисов для хранения, раздачи и воспроизведения.

Ответить
0

Облачные решения могут подвести на некоторых этапах, так что это временное решение.  
Так в каком формате аудио файлы? Есть ли система сжатия?

Ответить
0

Конечно, делаем постпродакшен и сжимаем. Формат mp3

Ответить
0

Раздули из обычной фичи новостного сайта какую-то сенсацию 🤦‍♂️🤦‍♂️🤦‍♂️

Это обычная студенческая работа, ничего гениального в этом нет. Вы просто интерфейсная прослойка между новостным порталом и спичкитом Яндекса, о чем вы говорите? Ровно также можно подключить и другие синтезаторы голоса. Лучше бы свой синтезатор сделали, а не зависели бы от других.

Новостному сайту наверняка будет проще сразу озвучивать новость через Яндекс, это для них будет гораздо дешевле, чем сидеть у вас на абонентке. Реализовать это — вопрос 2 недель и 100-150 тыс или найти смышленного фрилансера или студента, который может и за 30 тысяч сделать. Не вгоняйте людей в заблуждение! Притом, что уже и референс есть и ничего нового придумывать не нужно.

Обучаемая система — это смешно, вы просто строите словари с ударением. Не питайте людей красивыми словами.  Особенно посмеялся с так называемых «инженеров» — делать словарь ударений, конечно, безумно сложно (ирония). 

Завтра Яндекс сделает свой сервис и закроет доступ к своему API, а вы будете сидеть в каминг-ауте. Займитесь чем-нибудь своим лучше, пока не поздно. 

Ответить
0

Игорь, спасибо за критику. На «сенсацию» не претендовали, совсем )
Давайте разбираться по порядку:

1. Мы так и написали: «Не путайте, Retell — это не платформа Text-to-Speech, конкурирующая с TTS от корпораций, а сервис для онлайн-изданий...». Никого в заблуждение не вгоняем. К тому же, помимо синтеза у нас много дополнительных и полезных функций, таких как статистика прослушивания, кастомизация плеера, словари и другие

2. Мы пообщались более чем с 200 изданиями, сделать «своё» для них совсем не проще. Своими регистрациями издания это подтверждают.

Уверен, что за «2 недели и 100-150 тыс.» такое не реализовать, но даже если допустить этот вариант, то этих денег среднему изданию, выпускающему от 30 до 70 статей ежедневно, хватит минимум на 2,5 года подписки в нашем сервисе. И тут уже выбор за ними.

3. Возможно, что «Завтра Яндекс сделает свой сервис и закроет доступ к своему API», но пока что сам Яндекс рекомендует использовать наш сервис
https://vc.ru/yandex.cloud/80606-shiny-metal-backside. Цитата:

«Разработчикам и продуктовым командам, как правило, не составляет труда разобраться с API самостоятельно. Бизнесу это сложнее, поэтому мы работаем с партнёрами, которые берут эти заботы на себя — к примеру, с командой Retell, которая поставила озвучку контента на поток.»

Ответить
0

Здравствуйте! Не думали ли вы обучать модель text-to-speech на видео с YouTube, где есть хороший продакшн звука и субтитры? 

Ответить
0

Добрый день! Честно скажем, не пробовали. У нас ведь не text-to-speech платформа, сам синтез - это не наша фишка, Retell - это про исключительную простоту добавления озвучивания на сайты и удобство читателей (или правильнее сказать - слушателей).

Ответить
–1

Сначала хотел написать развёрнутый ответ, но только не на том, что заставляет тебя думать, а потом ещё и говорить, что это не мое. Если ты умеешь и не умеешь мысли сформулировать — лучше делай сам. Но ты считаешь, что ты неправ.

Ответить
0

Расскажите, пожалуйста, как вы без помощи кого-либо сталкивались с подобным. Я не удивлюсь, если это будет решающим фактором. Не понимаю, за что минусую.

Ответить

Комментарии