Audio Wikipedia - удобный способ слушать (и смотреть) статьи

Статья про <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fyoutu.be%2F-YtRRoUXf60&postId=353697" rel="nofollow noreferrer noopener" target="_blank">Путина</a>
Статья про Путина

Каждый из нас пользуется Википедией, когда хочет узнать что-то новое. Но читать часто бывает неудобно. Поэтому я написал программу на Python для озвучивания статей, которые затем выкладываю на YouTube канал - Audio Wikipedia RU.

Задумка

Я очень люблю аудиокниги и, как и большинству людей, мне часто приходится читать Википедию. Поэтому я начал искать способ слушать статьи, ведь времени на прочтение часто не хватает. Но найти бесплатный, удобный сервис, да ещё и с нормальным голосом так и не удалось.

Есть несколько каналов на YouTube, на которые выкладывались озвученные статьи, но в них был ужасный голос и просто статичная картинка в течении всего ролика.

И я решил написать свою программу для озвучки на языке Python. А для монтажа видео использовал FFmpeg, т.к. библиотека MoviePy оказалась слишком медленной для таких больших объёмов видео.

Главные преимущества

В видео используется один из лучших голосов для озвучки из доступных на данный момент, который значительно приятнее остальных.

Момент из видео про испанку

И главное, вместо статичной картинки в течении всего видео, показывается именно тот фрагмент, который озвучивается в данный момент. Программа ориентируется на заголовки и подзаголовки внутри статьи и прокручивает изображение, так чтобы была видна нужная часть статьи. А все иллюстрации, графики, таблицы и т.п. при этом сохранены и видны так же как и на сайте.

Оформление статьи

Оригинальная версия
Оригинальная версия
Конечный результат
Конечный результат

Дизайн статьи в ролике значительно лучше, чем в оригинальной Википедии.

За основу берётся мобильная версия Википедии, которая выглядит приятнее стандартной.

После чего к ней применяется CSS, чтобы улучшить оформление, убрать квадратные скобки, обесцветить ссылки и т.д.

И затем статья масштабируется до 125%, чтобы её было удобно просматривать с телефонов.

Таймкоды и подзаголовки

Таймкоды из статьи про <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fyoutu.be%2FOtam93l3QjY&postId=353697" rel="nofollow noreferrer noopener" target="_blank">Байдена</a>
Таймкоды из статьи про Байдена

В описании к каждому видео есть таймкоды, которые позволяют удобно ориентироваться по статье и быстро находить нужную часть. Каждый таймкод соответствует своему заголовку или подзаголовку. А чем "глубже" подзаголовок, тем большее кол-во тире перед ним стоит.

Кроме того заголовки и подзаголовки выделяются с помощью пауз и интонаций, что позволяет ориентироваться в структуре статьи на слух.

Превью для видео

Превью видео про <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fyoutu.be%2FRtzQB1o-e_Q&postId=353697" rel="nofollow noreferrer noopener" target="_blank">Трампа</a>
Превью видео про Трампа

Превью также генерируются автоматически. Скачиваются первые несколько картинок, которые выдаёт Google по названию статьи. Потом они обрабатываются с помощью библиотеки Pillow. Картинки масштабируются и на них накладывается полоска с текстом и логотип Википедии. В конце остаётся просто выбрать подходящее превью из нескольких вариантов.

Достоинства такого формата и ситуации использования

  • Пока слушаешь можно гулять или заниматься другими делами.
  • Если нужно подготовиться по теме, но времени мало, то можно послушать нужную статью по дороге в школу, на работу и т.д.
  • Когда нужно ознакомиться со статьёй в поездке, значительно удобнее слушать её, изредка посматривая на иллюстрации, таблицы и т.д., если это потребуется, чем пытаться прочитать что-то на трясущемся экране.
  • Можно слушать и смотреть статьи во время еды, что сильно экономит время. И при этом можно сразу увидеть нужный фрагмент, что позволяет ничего не упустить.
  • Можно проводить больше времени с пользой.
  • Глаза меньше устают, т.к. не приходится постоянно смотреть в экран.
  • Эти ролики пригодятся людям, у которых есть проблемы со зрением.
  • Многие блогеры в своих видео просто пересказывают Википедию, так не лучше ли сразу слушать Аудио Википедию?

Недостатки

  • Иногда неправильно произносятся ударения и иностранные слова.
  • Бывает сложно воспринимать подобную информацию на слух, нужно привыкнуть.
  • Некоторые статьи просто не подходят для озвучки, например списки (Список стран по индексу человеческого развития). Поэтому таких на канале не будет.
  • Пока вышло не так много видео.

Заключение

На канале выходит по 5 видео в день, возможно число будет увеличено до 10. Статьи для озвучки выбираются из списка наиболее популярных. В будущем собираюсь создать такие же каналы на других языках.

Если есть какие-нибудь предложения или рекомендации, то напишите об этом в комментариях. Буду сильно благодарен.

1717
7 комментариев

Комментарий недоступен

3
Ответить

Очень сомнительный источник знаний, учитывая, что знания там может корректировать кто угодно.

3
Ответить

Ребят, идея интересная конечно. Но я думаю, что то по факту она не будет никому интересна.
Нужно разобраться, а вообще как люди попадают на википедию и как читают её. И скорее всего чаще всего только тогда, когда у человека появляется необходимость узнать про что-то. И мало кто читает все целиком.
А такой вариант, что давай во время пробежки или поездки включу википедию послушать - ну очень сомнительно лично для меня. Есть же подкасты, аудиокниги и т.д. Возможно, иногда будет появляться такая нужда, но будет это спонтанно и по определенным темам. Сомневаюсь, что кто-то будет искать специально в вашем Ютуб канале интересующие темы и готовиться к этому.
Еще момент, чтобы слушать Ютуб в дороге - нужна на него подписка, которая есть не у всех.

Вот вам такая идея: во-первых сделать подкаст, чтобы был на всех платформах, типа Яндекс Музыки.
Вместо того, чтобы выкладывать все подряд по популярности, сделайте подборку самых шизанутых и необычных статей на Википедии и выкладывайте каждый день. Что-то реально интересное и неизвестное и развлекательное. И делайте выжимку, не нужно это растягивать на 1.5 часа. Пусть будет 5-10 минут.
Такая идея мне кажется может зайти.

1
Ответить

Трамп, Дональд

Ответить

В Википедии фамилия всегда идёт первой.

Ответить

Проект интересный! А чем озвучивали статьи?

Ответить

крутая задумка! респект
а можно как-то сделать это более доступным для пользователей? например хочу послушать статью и как мне быть? оставлять заявку?

Ответить