Издательская группа «Альпина» начала использовать автоматическую озвучку книг вместо дикторов Материал редакции

Программа поможет холдингу сэкономить время и деньги на создание аудиокниг.

В закладки

Издательский холдинг «Альпина» запустил пилотный проект с компанией Speechki, которая помогает создавать аудиокниги с помощью технологий искусственного интеллекта. Об этом vc.ru рассказали в холдинге.

«Альпина» планирует выпустить 10 книг, озвученных с помощью ИИ, и посмотреть, как отреагирует аудитория: какими будут продажи и отзывы покупателей, рассказал заместитель генерального директора Alpina Digital Денис Петров. Условия сотрудничества компания не раскрывает.

Сейчас читатели ожидают, что почти все новые издания выходят и в аудиоформате, пояснил Петров.

«Использование ИИ позволит нам выпустить большое количество аудиокниг, озвучка которых хорошим диктором просто нерентабельна. Особенно это становится актуальным сейчас, когда книжный бизнес в стране под угрозой из-за закрытия магазинов и падения курса рубля», — отметил представитель издательства.

По расчётам холдинга, за счёт использования ИИ траты на озвучку удастся снизить в 5-10 раз. «О реальных значениях экономии можно будет говорить только тогда, когда мы перейдем к полноформатной озвучке ИИ и станет понятна экономика проекта», — пояснил Денис Петров.

«Альпина» выпускает нон-фикшн литературу (книги по бизнесу, саморазвитию, научно-популярной тематики), для которой высокохудожественная начитка не требуется, считает Петров. Но до последнего времени холдинг отказывался от озвучки с помощью ИИ, поскольку компанию не устраивало качество сервисов.

Speechki разработала технологию, которая позволила «всерьёз рассмотреть» её использование, отметил представитель холдинга. Например, робот понимает логику интонационных пауз, расставленных редактором в тексте, запоминает её и затем уже расставляет паузы самостоятельно.

Текст, озвученный профессиональным диктором, и ИИ.

По данным «Альпины», первыми использовать ИИ для озвучки книг в России начал сервис Storytel, который также сотрудничает со Speechki. В компании подтвердили vc.ru, что занимаются озвучкой книг с помощью ИИ.

По словам гендиректора Storytel в России Бориса Макаренкова, это хорошое решение для срочной записи аудиокниг, когда произведение может быстро потерять актуальность. «Также такая технология даёт возможность записать книги, которые мы, возможно, не смогли бы записать через чтецов: специализированные книги, которые интересны узкой аудитории», — добавил он.

В числе партнёров Speechki на её сайте также указана электронная библиотека Bookmate. Стоимость создания аудиокниги в сервисе — 20 рублей за 1000 знаков, указано в условиях. Срок озвучивания больших произведений составляет до 40 минут.

{ "author_name": "Галина Мубаракшина", "author_type": "editor", "tags": ["\u043d\u043e\u0432\u043e\u0441\u0442\u044c","\u043d\u043e\u0432\u043e\u0441\u0442\u0438","\u0438\u0438","\u0430\u043b\u044c\u043f\u0438\u043d\u0430"], "comments": 83, "likes": 36, "favorites": 46, "is_advertisement": false, "subsite_label": "media", "id": 119428, "is_wide": false, "is_ugc": false, "date": "Fri, 10 Apr 2020 19:16:59 +0300", "is_special": false }
Лаборатория качества
Уходим в online: как в «коронавирусной» спешке защитить себя от возможных потерь
Команда разработчиков Microsoft каждый месяц допускает 30 тысяч ошибок в коде, а ведь ее системами пользуются…
Объявление на vc.ru
0
83 комментария
Популярные
По порядку
Написать комментарий...
50

Я сначала офигел от качества и передачи эмоций в первой записи, а потом понял , что это как раз живой диктор. Данный метод пойдет скорее всего для непопулярных книг, бестселлеры же все таки лучше озвучивать живым диктором. Можно ведь и книги с помощью ИИ писать, тоже будет дешевле в 5-10 раз, но не факт, что это будут читать.

Ответить
8

Можно ведь и книги с помощью ИИ писать, тоже будет дешевле в 5-10 раз, но не факт, что это будут читать.

Наркоманы будут)

Ответить
–11

В сервисе upsaleslab.ru качество озвучки книг голосами намного лучше и выбор больше. Дополнительно можно еще ролик о книге сделать. Смотрите примеры как они озвучивают буквоеду и еще видео делают https://youtu.be/_Q9h1cE0zPg или Литрес это уже сделал, причем использовал тоже голосовые модели апсейлслаб последнего поколения. Почувствуйте разницу https://youtu.be/BPkfRpl8JN4

Ответить
4

Яндекс Оксана?
Идём сюда - https://cloud.yandex.ru/services/speechkit#demo вводим отрывок слов из ролика и.... 1-в-1.

Второй ролик озвучивается премиум голосом Яндекс Алёна.

Ответить
1

Не знаю..., по мне это же контентный мусор на ютубе.. Даже не представляю сколько людей досмотрит/дослушает это до конца.
Проще было книжным гикам платить за видео. Выхлопа больше было бы.
Типо такого:

Ответить
1

Мега у*бищно звучит

Ответить
1

диктор как будто под шафе.... 

Ответить
1

У диктора нарочито длинные паузы. Действительно, как робот))

Ответить
15

Ну так то пойдет для бизнес и технической литературы, только думаю, в приложениях обязательно нужно вводить функцию будильника с сигналом и вибрацией через заданные интервалы времени, иначе люди просто будут засыпать через 5 минут прослушивания)

p.s. В детстве у меня были пластинки со сказками, озвученными Ростиславом Пляттом, они до сих пор у меня в голове, насколько живо он передавал персонажей.   "Вы тут со светом сидите?" - "Со светом, со светом!",  кто помнит? 

Ответить
4

Есть один чтец на radiokniga, который читает книги с произношением а-ля 19 век, - очень сильно раздражает. Я бы его с удовольствием заменил на робота.

Ответить
4

Это не тот, который делает резкий подъем интонации на последнем слове в предложении?

Ответить
1

Он! :)

Ответить
3

Фубленах, две книжки мне испоганил когда-то исторических интересных. Не смог слушать.

Ответить
7

Как вообще можно слушать книги? Нихуя же не понятно.

Ответить
2

Художественная литература на ура заходит, если чтец хороший. Сам долго не понимал, но потом распробовал.

Ответить
9

Ну не знаю. Я книги когда читаю - озвучиваю их собственным голосом, в голове. Если какой-то левый мужик будет вмешиваться в этот процесс - ну это как если бы мою жену трахал посторонний, а я смотрел.

Ответить
2

Да, понимаю. Бывают просто мерзопакостные голос, интонации, наигранные эмоции. Особенно, когда ожидаешь мужское повествование, а есть только женский перекатывающийся голос. Бррр.
 
Попробуйте послушать что вам по вкусу, озвученное, например, Михаилом Горевым. Пока не встречал, кто читает лучше.
https://audioknigi-online.ru/xfsearch/chitaet/Михаил%20Горевой/

Ответить
3

Эх, спасибо, осталось время найти :) уже 10 лет не читаю книги 😭

Ответить
0

Времени почти никогда нет, но в дороге очень удобно слушать, если не надо думать о насущном. 30-60 минут в день прослушивания и за неделю-две можно среднее произведение осилить!

Ответить
5

Да я не езжу никуда. Фрилансер я. Из досуга - компьютерные игры и троллинг на висишечке

Ответить
1

По дороге в/из магазин/наливайку, перед сном вместо смартфона, в душе/ванной и т.д. Если совсем никак, то можно на работу устроиться — чем дальше путь, тем больше начитанность!

Ответить
1

А если еще и изобилие имен, географических обьектов в произведениях типа Имя розы или непривычные для нашего слушателя китайские имена... Читаю сейчас Темный лес Лю Цисыня и путаюсь в многочисленных китайских именах, что же будет на слух?

Ответить
0

Я в таких случаях в уме производил ремаппинг имён. Когда имя или слово плохо влезают в башку при чтении - я сам с собой договаривался произносить это слово иначе, чтоб не спотыкаться каждый раз. 

С аудио такое не проканает, конечно.

Ответить
–15

Хуёво. Уровень чтения -  3 - 4 класс.

Ответить
37

Х*ёво. Уровень комментария - быдло.

Ответить
4

Охуительно! Уровень парирования - мастер-тролль.

Ответить
–6

Быдло - оно обычно не я.

Ответить
5

В этот раз не повезло

Ответить
–1

Все так говорят

Ответить
2

Похоже на возвращение Олега

Ответить
10

Это пока что
Еще один маленький шаг к большому будущему роботизации 🥳

Ответить
12

Я не верю, что смогу слушать книги с таким же удовольствием, которое получаю от озвучки Чонишвили, Скляра, Кейнза и прочих. А что уж говорить про аудиоспектакли?

Но с другой стороны когда-то не верили, что компьютер победит человека в шахматах или что людям нужно будет больше 486кб оперативной памяти. Посмотрим. 

Ответить
0

Эх, набил бы я тебе рыло, да только Заратустра не велит.

640 КБ памяти с избытком хватит любому компьютеру.

Откуда, блядь, 486? 
2 4 8 16 32 64 128 256 512 1024 2048 4096 8192
Откуда?
Не, я понимаю, что у нас тут не хабр, но путать «разрядность» процессора с объемом памяти в конкретной цитате - ну такоэ.

Ответить
1

Успокойся. Я ошибся в цифрах, а ты и рыло мне хочешь набить и минус влепил. 

Ответить
–1

Да это же тоже цитата, ну ты чего?
И вот тебе плюсик.

Ответить
1

Слишком сложно для нашей больницы. Даже я - мемолог со стажем - не понял, откуда это.

Ответить
8

Так то давно используют говорилки в озвучке, вот только слушать это невозможно, заменить живого чтеца получится нескоро. Чтец же не только тупо озвучивает, он персонажей играет, у хорошего чтеца несколько голосов для разных персонажей и их не спутаешь

Ответить
–8

Готов поспорить )  посмотрите пример озвучки ии последнего поколения https://youtu.be/_Q9h1cE0zPg 

Ответить
7

А что тут спорить. Это невозможно слушать!

Ответить
–1

У вас есть нарекания к качеству озвучки, нейронная сеть последнего поколения  читает уже лучше многих авторов. Еще пол года и оригинал будет уступать.

Ответить
0

лет 10. Если ты считаешь, что это нормальная озвучка, сам её и слушай, эта бубнилка ничем от кожаных ублюдков не отличается

Ответить
0

сойдет. вполне продаваемый вариант.

Ответить
6

Они хитрецы, конечно: привели сравнение робота чтеца с диктором, который сам читает, как робот.

Ответить
3

Постоянно путает ударения (нет словаря?). Неаккуратно звучит стыковка фонем в рендере. Скудная и , главное, бестолковая редакция, из нужного только правка ударений. А самое первое что нужно в этих редакторах - правка интонации (вверх/вниз в конце слова, вопросительно, восклицательно). Этого НЕТ. Баг - невозможно править настройку ударений в заголовке... 

Ответить
–1

С боем догадался, что в визуальном редакторе можно ставить плюсик (точнее не совсем плюсик, а символ совпадающий с плюсиком, но не он) перед ударной гласной.

Ответить
–3

Да плюсик перед ударной гласной. Это стандарт речевых движков

Ответить
–3

Здесь можно править ударения https://upsaleslab.ru/ru/ozvuchka-texta-golosom-online

Ответить
2

Забавно, на vc постят лжеИИ компанию, которая юзает яндекс спичкит :D

Ответить
1

Speechki использует голосовой движок яндекс вы правы. 

Ответить
0

С чего вы это решили?

Ответить
1

Я его тоже использую, могу сделать копию предоставленной озвучки 1 в1

Ответить
0

Думаю текст дорабатывают. С ударениям у яндекса еще довольно много ошибок.  

Ответить
1

Давно пора. Качество отличное!

Ответить
–7

Коллеги, озвучка нейронными сетями двигается вперед очень быстро. В сервисе https://upsaleslab.ru/ru/ozvuchka-texta-golosom-online вы найдете 42 языка и 429 голосовых моделей последнего поколения сделанных на основе обучения нейронных сетей и ии.  Рекомендую потестируйте голос vladimir на русском почувствуйте разницу!!!

Ответить
2

Готовая бесплатная демка этого Владимира есть без регистрации и смс?

Ответить
0

Не работает только нифига, виснет на синтезе.

Ответить
1

просто бизнес похоже что)

Ответить
1

Для тех кто аудиокниги слушает на скорости х3 не нужен особо красивый голос все равно все сливается.

Ответить
1

Как то узнавал цену озвучки в профф агентстве, да цена анреал.
Но если надо срочно и дёшево, то мне кажется проще запилить краудсорсинг или как его там, короче предварительно одобренным 100 надомникам с норм голосами по 1 главе, это явно дешевле и уж точно быстро.
Короче чюбер...

Ответить
1

После прослушивания "Модели для сборки" не смог слушать синтетические голоса. Да, они стали намного качественнее,  но все равно нет той атмосферы , которую может передать профессиональный диктор. Возможно это будет полезно для бизнес литературы 

Ответить
0

Зашёл за комментариями про «Модель для сборки»

Ответить
0

Жаль, что только книги и весь сервис заточен чисто под книги. Озвучивание просто собственного текста с таким качеством я бы купил.

Ответить
1

Там можно любой текст залить, хоть озвучку для IVR (что я сделал)

Ответить
1

Да тоже запустил. Блин это охренительное качество.

Ответить
0

Есть вещи которые в жизни категорически нельзя менять , иначе мы перестанем быть живыми людьми с чувствами ))

Ответить
0

По факту большинство людей - роботы. Для них скоро будут другие сервисы писать книги.  Так что всё норм

Ответить
1

Пока чел плачет или улыбается - чувствует он ещё не робот 😊

Ответить
0

Что такое эмоции? Лишь запрограммированные реакции

Ответить
0

🤦🏼 ну да и вся жизнь это код - п-ц

Ответить
0

🤦‍♂️🤦🏻‍♂️🤦🏽‍♂️

Ответить
0

Началось восстание машин ☝️

Ответить
0

Ура! Я рад.

Ответить
0

зачем? Speech2text встроен в любой браузер и плеер. Пусть просто текст продают.

Ответить
0

А где чуваки с Робот Вера, которые впарили Тимуру Бекмамбетову, что все книжки теперь будет Путин озвучивать?

Ответить
0

speechki.org  норм проект. Кто делал?

Ответить
0

Наконец то, если аудио будет по цене электронной, это то что нужно для не художественной литературы

Ответить
0

Можно еще сделать роботов-писателей

Ответить
0

Учусь в институте и часто методички прослушиваю на pdf reаder, уверен, что через пару - тройку лет это станет сильно удобнее.

Ответить
0

ИИ ужасно безэмоционально звучит....

Ответить
–1

Детям такое слушать категорически нельзя! редкостная жесть...

Ответить

Прямой эфир