Спасибо за обзор и лестные слова, но ради точности отметим, что ни с Яндексом, ни с их сервисом SpeechKit мы никак не связаны 😉
А про нас мы уже писали вот тут https://vc.ru/tribuna/232706-ne-nashli-nuzhnuyu-audioknigu-psihanuli-i-sozdali-platformu-dlya-ozvuchivaniya-knig-istoriya-speechki
Большой привет и уважение команде Логомашины!
Мы — Speechki. Наш ванлайнер звучит как: Speechki is an audiobook recording platform for publishers to scale their audiobook inventories by several times thanks to synthetic voices.
Если кратко и по-русски: Speechki — сервис для создания аудиокниг с помощью нейро-дикторов. С нашим ИИ мы записываем аудиокниги для издательств на 70 языках, в 30 раз быстрее и 10 раз дешевле, чем при записи человеком в студии. Кстати, мы уже рассказывали о себе на vc.ru https://vc.ru/tribuna/232706-ne-nashli-nuzhnuyu-audioknigu-psihanuli-i-sozdali-platformu-dlya-ozvuchivaniya-knig-istoriya-speechki
Ну что, Логомашина, сделаете нам крутой лого? Старый лого и знак прикрепили.
p.s. несмотря на то, что название Speechki для русскоговорящей аудитории имеет прямую ассоциацию со «спичками», мы строим глобальную компанию на рынке, где российский сегмент - лишь очень маленькая часть, поэтому чтобы не сбивать с толку 95% книжный издательств, мы бы не хотели визуал хоть как-то связанный со «спичками». И да, хоть в названии мы и «побаловались», но для них мы звучим адекватно, как Speech + Key.
Относительно стоимости, то она рассчитана исходя из расценок по мировому рынку аудиоиздания. На российском рынке цены, действительно, ниже, но и сам рынок совсем небольшой относительно мирового. Еще один момент, $3,000 - это не размер гонорара диктора, а затраты издательства, включающие и вознаграждение диктора, и услуги студии, звукорежиссера, редактора, пруфера, зарплаты менеджеров и других специалистов, участвующих при производстве аудиокниги традиционным способом.
Volodymyr, добрый день! Ссылка на сайте есть в самом конце статьи, но сама статья была написана не для продажи нашего сервиса, а для раскрытия темы. Поэтому активно и продвигали наши контакты. И что касается украинского, то да, украинский язык наш сервис поддерживает. Если возникнут вопросы, можете написать нам на почту hello@speechki.org
Спасибо за ваш комментарий. Музыка, произведённая роботом, уже, кстати, существует в Японии, и довольно давно. Можете поискать, вдруг вам это придётся по душе, чем современные отечественные музыканты :)
Разноголосое чтение у нас уже реализовано. А так как у нас есть и мужские и женские голоса, то можно озвучивать и с разбивкой на разный пол чтецов.
Вы можете воспользоваться нашим сервисом на нашем сайте https://speechki.org/. Зарегистрируйтесь, загрузите свою книгу в формате docx, выберите подходящий голос.
например?
Если мы правильно поняли, то вы хотите полученное аудио наложить на уже имеющееся видео с курсом, чтобы речь на русском попадала точно на место иностранной. Верно?
Если все так, то тут мы можем порекомендовать воспользоваться каким-либо видеоредактором, добавив туда слой с нашим аудио, а затем разделить его на фрагменты и установить на нужные отрезки времени, чтобы всё совпадало.
В Speechki вы можете получить озвученный текст, но все другие манипуляции вам нужно будет производить с помощью сторонних приложений.
Сергей, спасибо вам!
Павел, большое спасибо!
Спасибо за комментарий. Да, синтез речи всё еще неидеален и отличается от человеческой речи. Однако, мы усердно работаем нам тем, чтобы прослушивание аудио, записанного ИИ, было привычным и приятным с самого начала. Причем вне зависимости от жанра.
Спасибо, Алексей!
Большое спасибо за отзыв! Конечно, если сравнить две аудиокниги, одну записанную синтезом в Speechki, а другую профессиональным диктором, то 99 человек из 100 выберут аудиокнигу от диктора. Поэтому часть книг, включая наиболее популярные и востребованные, по-прежнему будут озвучиваться людьми, а что касается длиннющего "хвоста" из неиспользованных прав на произведения, которые простаивают без аудио версии, то тут мы и видим нашу максимальную пользу.
С одной стороны, мы хотим помогать читателям/слушателям иметь доступ ко всему нужному им контенту в удобном для них формате, а издательствам монетизировать этот контент и быть в прибыли.
Андрей, мы писали в статье, что не хотим забирать хлеб у дикторов. Мы уверены, что те книги (4.5% от всех выпускаемых), которые сейчас озвучиваются с помощью дикторов, продолжат создаваться традиционным способом, а вот те 95.5%, которые никогда бы не получили аудиоверсию ранее, мы бы хотели взять на себя.
Спасибо за отзыв о качестве статьи!
Сейчас бы в большей степени заточены под книги и их конвертацию в аудио формат. Но некоторые пользователи озвучивают статьи, инструкции, материалы для аудиогидов. Русский язык у нас есть, и он звучит хорошо. Поэтому можете сформировать все ваши материалы в документ docx, разделить его логические части заголовками и "скормить" его в Speechki. По итогу вы сможете скачать ваши материалы либо единым аудиофайлом, либо отдельными с разбивкой по обозначенным главам.
Ярослав, спасибо за отзыв и пожелания! Мы очень активно работаем над тем, чтобы звук и естественность речи улучшались, чтобы через какое-то время впечатлить и вас, и многих других слушателей, которые всё еще относятся к синтетической речи скептически.
На счёт авторских прав, с ними нет никаких проблем. Мы не производим аудиокниги сами и не продаем их, а предоставляем наш сервис для издательств, позволяя им быстро и дешево расширить свои аудио каталоги. А у этих издательств права, естественно, есть.
На счет синтеза от Apple - возможно, но те же MS Azure, AWS, Google очень даже неплохи. Есть и крутые провайдеры синтеза на русском языке.
В личке ответили. Спасибо, Андрей!
Да, это очень классный сервис. Спасибо!
Такой плюс у синтетического голоса есть, верно. Однако, все зависит от материала и жанра. Монотонность подойдет не для всех жанров и произведений. С другой стороны, технологии синтеза очень активно идут в сторону того, чтобы можно было успешно записывать все жанры, и с эмоциями и интонациями, и без них - на выбор.
Олег, напишите нам на hello@speechki.org c радостью поможем разобраться и решить все возникшие трудности с тестированием нашего сервиса.
Елена, да, в плане голоса все передовые голоса звучат примерно на одном уровне, и тут дело персонального вкуса. Но что касается интонаций, пауз, то сырое сгенерированное аудио будет сильно проигрывать тому, которое прошло через предварительную аудиоподготовку и разметку тегами, а также проверку и корректировку на пост-продакшене. Для коротких заметок это может работать, да, но на объеме аудиокниги в 8-10 (а бывает и в 70+ часов) эта разница ощущается максимально сильно. Уж поверьте.
Статья получилась объемной, это да. Честно понадеялись, что попадем в число тех материалов, у которых на vc.ru появляется автоматическая озвучка. Это бы облегчило ознакомление. Спасибо за комментарий. Надо сказать, что за 4 года речевые технологии сделали невероятный прыжок в качестве.
Да, озвучивать выжимки - это отличная идея. И мы даже работаем с несколькими компаниями, которые такие саммари делают.
Спасибо!
Сергей, всё верно говорите. Ошибки возможны, но прелесть в том, что мы можем их исправлять моментально. Благодаря нашему редактору издательство может установить нужное ударение, произношение или заменить аббревиатуру, которую сложно воспринять на слух (все-таки есть отличия в потреблении текстовой и аудио версий книги).
Тоже самое и про иностранные слова, предложения или фразы. М все это можем объединять. Постарались описать эти возможности в части "А как это вообще всё работает?", но кажется, что стоит выпустить отдельный материал с подробной демонстрацией того, как все эти ошибки и сложные случае преодолевать с помощью Speechki.
Большое спасибо, Дмитрий!
Михаил, в комментарии выше, верно заметил, что мы не продаем контент. Мы работаем с издательствами, которые используют нас сервис как услугу по записи аудиокниг, аналогично тому, если бы они пришли заказать озвучивание в студию звукозаписи. Только в случае со Speechki это можно сделать прямо в браузере, без личшних движений и долгих согласований.
Собрали на коленке несколько GPT. Если есть подписка, посмотрите, дайте обратную связь, пожалуйста:
1. Определит ваш возраст по фото - GPT (https://chat.openai.com/g/g-MAlP8HGOc-how-old-do-i-look)
2. Определит вашу национальность - GPT (https://chat.openai.com/g/g-CDaZrkq8G-nationality-guesser)
3. "I am Rich" - GPT (https://chat.openai.com/g/g-UtTGD4IaY-i-am-rich)
4. И, разумеется, GPT нашего Text-to-Speech сервиса Speechki - GPT (https://chat.openai.com/g/g-mNEDiiygc-speechki)