Можно ли научиться слушать лекции и подкасты в 5 раз быстрее?

Иногда да, рассказываем как.

В последние годы аудиоформат становится все популярнее. Это неудивительно, потому что прослушивание лекций и подкастов легко совмещать с другими делами. Однако получение информации через аудиоканал уступает письменному тексту в скорости: темп чтения чуть ли не вдвое выше скорости, с которой мы говорим. 250-300 слов в минуту против 120-150 слов. Получается, что у нас есть ресурс для понимания аудиоинформации в ускоренном виде.

Исследование подготовлено Лабораторией функциональной нейрофизиологии Университета 2035

Можно ли научиться слушать лекции и подкасты в 5 раз быстрее?

Инструмент варьирования скорости воспроизведения аудио сегодня есть на самых разных платформах. Вот лишь несколько примеров:

Яндекс позволяет ускорять подкасты в 2 раза с шагом 0,25
Подкасты IOS также имеют ускорение до 2 раз с шагом 0,5
Сервис Google не только дает возможность ускорения в 3 раза с шагом 0,1, но и предлагает опцию сокращения пауз (trim silence)

Max Deutsch создал приложение, в котором темп речи диктора мог увеличиваться постепенно с небольшим шагом. Плавность изменения темпа позволяла незаметно для самого слушателя достигать высоких скоростей. Однако приложение не набрало популярности и пропало из Appstore.

Безусловно, ускорять аудиоматериал можно лишь до определенного предела. Согласно исследованиям, средняя скорость, на которой понимание начинает существенно ухудшаться, составляет 275 слов в минуту (для английского языка). Прослушивание аудиотекста на предельном для понимания ускорении отнимает много ресурсов и утомляет. Однако умеренное ускорение не приводит к таким последствиям, способствует повышению концентрации и положительно сказывается на понимании.

Исследование, проведенное на учащихся, показало более высокий тестовый балл в группе, которая обучалась на ускоренном материале, а также сокращение времени на обучение на 32%.

Возможность понимать текст при его сжатии во времени сохраняется благодаря такому свойству языка как избыточность. Избыточность текста проявляется на разных уровнях: фонетическом (например, мы можем узнать слово "привет" в "првт") или грамматическом (указание на множественное число отражается в формах сразу нескольких слов – "они были солдатами"). Избыточность позволяет нам понимать смысл даже в условиях зашумления или на большом ускорении.

Существуют разные алгоритмы сжатия аудиотекста (детально описаны у Arons). Среди способов сжатия выделяют:

изменение частотных характеристик аудио;
удаление пауз;
сокращение длительности гласных.

Лучше всего работают алгоритмы, основанные на устранении избыточности языка, при этом не изменяющие высоту голоса диктора. Однако важно помнить, что без характеристик избыточности текст перестает быть помехоустойчивым. Это значит, что внешний шум и любые другие отвлекающие факторы будут сильнее сказываться на понимании.

Интересный алгоритм, не сокращающий объем передаваемой информации, основан на так называемом дихотическом прослушивании. Текст нарезается на отрывки, после чего в одно ухо подается ряд последовательно идущих нечетных участков текста, а в другое – четных, но со сдвигом на пол сегмента. Другой вариант с дихотическим предъявлением заключается в том, что запись в одном из наушников предъявляется с задержкой в 7,5 мс. Авторы предположили, что в последнем виде дихотического предъявления разборчивость текста повышается за счет так называемой бинауральной избыточности, увеличивающей время для распознавания речи.

На понимание ускоренного текста могут влиять как содержание, так и форма. Например, текст может быть достаточно коротким, но информационно нагруженным. В таком случае для его осознания потребуется больше времени, чем для длинного, но ненагруженного текста. Также на понимание влияют сложность построения предложений, грамматических конструкций. Было показано, что материал, содержащий более длинные предложения, приводил к ухудшению его восприятия на 20% при различных протоколах ускорения.

В понимании информации важную роль играет степень знакомства с темой, знание используемой терминологии, частотность слов. Неизвестные ранее или редкие слова могут плохо распознаваться на большой скорости, что приводит к общему снижению понимания текста. Низкая структурированность материала также плохо влияет на понимание сообщения.

Из формальных характеристик аудиотекста важными оказываются характеристики голоса. Голос может быть женским или мужским (причем предпочтительность того или иного зависит от пола слушателя, содержания текста и других факторов), он может быть высоким или более низким. Неравномерная скорость, а также непривычная для нас манера разговора диктора могут снижать эффективность понимания.

Данные показывают, что наша перцептивная система действительно может адаптироваться к восприятию ускоренного материала. Самым ярким примером можно считать способность незрячих людей достигать понимания материала на феноменальном уровне сжатия – 22 слога в секунду, это примерно 660 слов в минуту для немецкого языка, на котором проводилось исследование.

Чтобы оценить эти цифры, послушайте примеры речи со скоростью 14 слогов/сек и 21 слог/сек, предложенные Douglas Fields. Расшифровка текста: "Blackwater, now called Xe Services, was once the United States’ go-to contractor in Iraq and Afghanistan. It has been under intense pressure since 2007, when Blackwater guards were accused of killing 17 civilians in Nisour Square in Baghdad. The company, its executives and personnel have faced civil lawsuits, criminal charges and congressional investigations surrounding accusations of murder and bribery. In April, federal prosecutors announced weapons charges against five former senior Blackwater executives, including its former president".

А также действующий мировой рекорд по скорости произношения слов, принадлежащий Eminem 2:57 (229 слов за 30 секунд, что составляет 11,3 слога/сек), и мировой рекорд 1998, где Rebel XD достиг 20 слогов/сек!

Авторы выделяют два типа адаптации к ультрабыстрой речи: краткосрочная и долгосрочная.

Основная масса работ по ускоренному прослушиванию исследовала краткосрочный тип адаптации. В таких исследованиях эффект ожидался от небольшого количества прослушиваний (10-20 предложений). Оказалось, что лексическая составляющая тренировочного материала не является важной для краткосрочной адаптации, а ритмическая схожесть, напротив, играет большую роль. Это значит, что при прослушивании бессмысленных слов, имеющих сходную ритмическую составляющую с родным языком, адаптация происходила. При этом перенос эффекта на родной язык не возникал при прослушивании фраз на ритмически не схожих языках. Попытка использовать различные типы зашумления текста в качестве тренировки распознавания сообщения также не привела к положительному эффекту. Краткосрочная адаптация распространялась на широкий круг стимуляции: на другую тематику, на другой голос (в том числе другого пола) и на другой схожий язык. Адаптационный эффект краткосрочного типа в определенной степени наблюдался даже через год.

Исследований в области долгосрочной адаптации не так много, однако в большинстве из них были получены положительные результаты. Например, в работе исследовательской группы Banai тестировались различные протоколы тренировок. Все тренировки показали свою эффективность по сравнению с контрольной группой. Важно, что в их эксперименте наблюдался перенос эффекта при смене материала и диктора.

Нейронные механизмы адаптации к ускоренной речи можно рассматривать с точки зрения двух компонентов: акустического и лингвистического. Первый связан с адаптацией к новой структуре акустического сигнала, новой ритмике, возникающей из-за сжатия аудио. Второй компонент, лингвистический, связан с содержанием сообщения.

Исследования с фМРТ показывают, что при прослушивании аудио, помимо других структур, активны височные отделы слуховой коры в обоих полушариях. Активность отделов правого полушария линейно растет с увеличением ускорения вне зависимости от разборчивости сообщения – это является проявлением акустического компонента.

Напротив, активность в верхней височной борозде левого полушария сначала повышается при увеличении ускорения, но затем снижается, когда ускорение достигает предела и текст перестает распознаваться. Экспериментальные данные выявили двух-, трехкратное увеличение активности в этой области при прослушивании быстрой речи в сравнении с нормальной скоростью. При продолжении предъявления текста на той же высокой скорости наблюдалось снижение активации по мере адаптации к ускорению, которая по отчетам испытуемых сопровождалась привыканием к темпу и отсутствием трудностей в понимании сообщения. Такая локализация и закономерность активации отражает лингвистический компонент. Интересно, что вентральная премоторная область активировалась с аналогичной закономерностью. Такое вовлечение ассоциированной с продуцированием речи области может помогать в понимании в сложных условиях прослушивания.

Слева: мозговое представительство компонентов адаптации к ускоренному прослушиванию. Справа: синим - вентральная премоторная область, красным - верхняя височная извилина.

Адаптация к ускоренному прослушиванию также наблюдается на уровне ритмов головного мозга. Выявлено, что активность в тета-диапазоне (4-8 Гц) подстраивается под частоту слогов речи. Однако на определенном уровне ускорения происходит рассинхронизация ритмов мозга и темпа речи. Считалось, что именно невозможность подстройки тета-активности под ритм слогов является препятствием для понимания текста на большом ускорении. Однако есть гипотеза, что невозможность понимания текста на высокой скорости связана с нарушением высокоуровневых направляющих процессов. Так, понимание текста нарушается в связи с нехваткой ресурсов внимания и невозможностью перцептивной системы производить предсказания в столь быстром темпе. Это отражается в сниженной активности в высокочастотном бета диапазоне (14-21 Гц).

Пример электрической активности головного мозга при прослушивании аудиокниги с возрастающим ускорением

Таким образом, есть несколько возможных мишеней для использования нейрофидбека (биологической обратной связи), которые позволяют повысить продуктивность при прослушивании аудиотекста.

Итак, есть веские основания предполагать, что тренировка ускоренного прослушивания возможна. Более того, пилотные исследования, которые проводит лаборатория функциональной нейрофизиологии Университета 2035, поддерживают это предположение. Участники исследования проходили тренировки в течение нескольких дней и на момент последней тренировки некоторые доходили до скорости прослушивания аудиоматериала, превышающей тройное ускорение – около 450 слов в минуту.

Групповые результаты тренировок по ускоренному прослушиванию

Однако целый ряд вопросов до сих пор остается открытым. Какие методики являются наиболее эффективными? Каков скоростной предел понимания текста? Где границы переноса этого навыка? И наконец, возможно ли с помощью тренировки ускоренного прослушивания улучшать более глобальные когнитивные навыки? Можно присоединиться к исследованию лаборатории функциональной нейрофизиологии и протестировать свои способности. Для этого надо отправить заявку на почту.

Можно ли научиться слушать лекции и подкасты в 5 раз быстрее?

Быстро и понятно. Что делает ускоренное прослушивание эффективным

Можно ли «прокачать» слушателя для повышения его продуктивности?

Как адаптироваться к быстрой речи

Как мозг адаптируется к ускоренному прослушиванию?

Как научиться ускоренному прослушиванию?