Может ли аудио заменить текст? Разбираемся вместе с экспертами

Сервис Retell изучил статистику и мнения экспертов в медиа. Пройдите опрос и прочитайте статью с выводами, которые нас, мягко говоря, удивили.

Задумывались ли вы о том, сколько аудиоконтента вы потребляете в день? Это могут быть любимые музыкальные альбомы, аудиокниги или подкасты. Проводя анализ рынка внутри компании, мы пришли к интересным выводам.

Внимание, опрос! Перед тем, как ознакомиться со статьей, расскажите нам, как вы предпочитаете потреблять контент — читая или слушая.

Как вы предпочитаете потреблять контент?
В основном я читаю.
Чаще всего я слушаю.
И то, и другое.
Хочу посмотреть результаты.
Рост слушателей подкастов в США Скриншот: Edison Reasearch and Triton Digital
Рост слушателей подкастов в США Скриншот: Edison Reasearch and Triton Digital

А пока мы, сеть аудиорекламы в интернет-СМИ Retell, поделимся нашим прогнозом о том, что аудиоформаты ждёт большое и светлое будущее.

Исследование Edison Research 2020 года показало, что в США слушают подкасты 155 миллионов человек — это почти половина от общего населения Штатов. В России же, по данным ВЦИОМ на февраль 2020 года, каждый пятый россиянин слушает подкасты, при этом почти половина из опрошенных — люди в возрасте от 18 до 34 лет.

Если говорить о появлении подкастов в СМИ, то сейчас они уже не особенность и не модная фича, а, пожалуй, вынужденная необходимость (почему — в конце текста расскажет наш спикер). И если раньше с этим форматом СМИ только заигрывали, то сейчас большинство крупных онлайн-изданий используют голос как один из основных инструментов донесения мысли наряду с текстовым форматом.

Возьмём в качестве примера интернет-издание Meduza. У них есть 13 тематических подкастов, 9 из которых стабильно обновляются и постоянно продляются новыми сезонами.

Подкасты на сайте Meduza Скрин: Meduza
Подкасты на сайте Meduza Скрин: Meduza

Подкаст образован от двух слов iPod и broadcast. Это аудиопередача или блог, который объединяет одна конкретная тема. Фактически это та же радиопрограмма, только вы можете прослушать её в любое удобное время. Справочники подсказывают, что подкаст — это так же и аудиодорожка, которую вы можете скачать/найти в интернете и прослушать на своём устройстве.

Retell конвертирует тексты онлайн-изданий в аудиостатьи. Продукт, который получают наши клиенты, не является подкастом в привычном смысле этого слова, но считается им по определению.

Мы активно агитируем за доступность новостей, статей, лонгридов в формате аудио по умолчанию. К сожалению, озвучивание профессиональным диктором не всегда подходит для многих материалов — тексты необходимо публиковать, пока они «свежие», пока актуален инфоповод. Поэтому озвученные при помощи искусственного интеллекта материалы в таких случаях очень актуальны. Кроме того, существует определённый пласт людей, которые легче усваивают услышанное, чем увиденное. Для них расцвет аудиоформатов происходит как нельзя кстати.

Чем хорош синтез речи?

  • Сходство с живой речью. Технологии Text-to-Speech активно развиваются, поэтому качество голоса ИИ с каждым днём всё ближе и ближе к реальной человеческой речи. За последние два года технологии совершили огромный скачок;
  • Скорость. По нашим личным наблюдениям, средний текст, публикуемый в онлайн-издании, состоит из 1500-3000 тысяч символов. На озвучивание материала такого объёма уходит меньше минуты. Это позволит оперативно снабдить важную новость или статью аудиоверсией без потери времени. Даже лонгрид на 10-15 тысяч символов искусственный интеллект обработает всего за несколько минут;
  • Удобство. Люди приобщаются к привычкам Цезаря и умудряются совмещать несколько дел. Послушать за рулём статью об озоновых дырах? Да! А может лучше совместить мытьё посуды с прослушиванием текста о тайм-менеджменте и личной эффективности? Да, и ещё раз да!й новой волны? Да, и ещё раз да!
  • Доступность для людей с ограничением жизнедеятельности. Например, людям с плохим зрением порой нелегко читать большие полотна текста.

Но вообще с роботом не всё так гладко. Не будем забывать, что это, прежде всего, искусственный интеллект, и он всё ещё может допускать ошибки в ударениях и не так хорошо управляется с интонациями. С этим, впрочем, и у реальных людей бывают проблемы. Например, для своего сервиса мы разработали словарь, в котором можно единожды задать правильного произношение какого-либо слова (это может быть название организации, фамилия героя статьи или спикера, аббревиатура), чтобы при следующих упоминаниях этого слова или фразы искусственный интеллект произносил всё по умолчанию правильно.

Кроме этого у нас есть визуальный редактор, напоминающий Microsoft Word. Он помогает корректировать уже сгенерированную аудиостатью, внося изменения в синтез речи совершенно без знаний SSML (прим. ред — Speech Synthesis Markup Language, в переводе на русский, язык разметки синтеза речи). В этом редакторе вручную расставить правильные паузы, интонации, ударения, увеличить или уменьшить скорость произношения, чтобы прослушивание не приносило никакого дискомфорта пользователям.

Вот так выглядит визуальный редактор синтетической речи на сайте Retell Скрин: Retell
Вот так выглядит визуальный редактор синтетической речи на сайте Retell Скрин: Retell

А в чём профит для СМИ?

Ни для кого не секрет, что все независимые сетевые издания (и не только они) живут во многом за счёт рекламы. Поэтому внедрение для своей площадки новых форматов может в разы увеличить прибыль. Чем могут быть полезны озвученные тексты, если вы владелец СМИ?

Аудиоконтент — это дополнительный трафик на ваш сайт.

Во-первых, аудиоконтент — это дополнительный трафик на ваш сайт. Например, пользователи, которые в течение дня заходили на ваш ресурс всего один раз, могут зайти повторно, чтобы послушать интересные статьи во то время, когда руки и глаза заняты чем-то другим. Благодаря дублированию на сайте текстового контента в формате аудио, онлайн-издание начинает конкурировать с музыкальными или стриминговыми сервисами, с платформами для подкастов, а у аудитории появится дополнительный выбор при подборе контента для досуга.

Помимо количества просмотров статьи главный редактор сможет отслеживать ещё и прослушивания. Это позволит лучше понять запросы аудитории на те или иные темы.

Аудиоконтент — дополнительная монетизация за счёт встроенной рекламы.

Во-вторых, это дополнительная монетизация за счёт встроенной рекламы. Да, любая реклама, и аудиореклама в частности, бесит слушателей, но чаще всего лишь в тех случаях, когда она длится долго. Кстати, Mediascope узнали, что приемлемая длительность рекламы по мнению 53% респондентов — 15 секунд. Ещё 20% заявили о готовности слушать не более 20 секунд рекламных аудиороликов.

Сколько секунд пользователи готовы слушать рекламу? Скриншот: Mediascope
Сколько секунд пользователи готовы слушать рекламу? Скриншот: Mediascope

Сайт становится привлекательнее для рекламодателей.

В-третьих, благодаря тому что ваше интернет-издание следует трендам, ваш сайт становится привлекательнее для рекламодателей. Прежде всего они видят в вас дополнительную площадку для продвижения своего продукта. Но и ещё тот факт, что вы следуете трендам, может помочь вашему имиджу.

Аудиореклама эффективнее баннерной.

В-четвёртых, аудиореклама значительно эффективнее баннерной: рекламный аудиоролик заметит практически каждый внимательный слушатель, её не скроет никакое приложение для заглушки рекламы. К тому же здесь нет конкуренции за внимание пользователей, как это бывает с визуальными объявлениями.

А может ли аудио вытеснить текст?

Этим вопросом задаются многие медийщики. Мнения на этот счёт расходятся. Кто-то уверен, что люди со временем перестанут читать и будут только слушать. Кто-то наоборот считает, что тексты всегда будут популярнее звука.

Мы решили узнать мнение Александра Жирова — автора телеграм-канала о региональных СМИ «Местами», который уже много лет работает в медиа и пристально следит за всем, что происходит на журналистской «кухне».

Поскольку люди делятся на тех, кто воспринимает информацию визуально и аудиально, сосуществование двух форматов: текста и звука – неизбежно. Вряд ли можно говорить о конкуренции этих форматов – в случае, если они дополняют друг друга или работают для аудиторий, по-разному воспринимающих информацию.

Сегодня на российском медиаполе не так много подкастов, которые рассказывали бы истории или адаптировали текстовые материалы для аудиалов. В основном, упор делается на разговорные подкасты – это не всегда плохо, но это другой жанр – ты как бы подслушиваешь беседу других людей, создаётся эффект присутствия. <...>

Текст и аудио дополняют друг друга, рождая новый «мультиплатформенный» формат. <...>

Как историк по образованию и медийщик по случайности, предположу, что человечество уже прошло этап исключительно звука – рассказов историй у костра, и, кажется, теперь прощается с «голым» текстом. Теперь рождается новый формат – и наша задача: понять, какой именно и как с ним работать.

Александр Жиров, Автор телеграм-канала «Местами», редактор, журналист.

Спасибо, что дочитали до конца! В комментариях вы можете поделиться своими мыслями о нашей статье и небольшом исследовании, а ещё вы можете задать вопросы об аудиоконтенте и аудиорекламе. А мы постараемся осветить это в наших будущих публикациях.

77
5 комментариев

Ну, учитывая что жанр подкастов, стримов и аудиокниг сегодня вполне популярны, то ответ очевиден. 

2
Ответить

Тренд аудио есть, это точно! Но что на счёт того, что аудио заменит текст, и мы  с вами будем жить в audio-first мире?

1
Ответить

Читать нужно больше, а не слушать. Если уж во все тонкости темы человек не вникнет, но хотя бы увидит как слова правильно пишутся. 

2
Ответить

Хорошая статья

2
Ответить