Текст-майнинг с пандами, облаками и яблоками
Представьте ситуацию: вас назначили спикером на мероприятии, и вы даже знаете, о чем хотите рассказать аудитории. Но будет ли публикой воспринят ваш доклад так, как вы себе это представляли? Давайте посмотрим, что может пойти не так и как это исправить.
Как часто нам приходится выступать с докладом, презентацией, проводить обучение, быть спикером на конференции? Если деятельность напрямую не связана с человеческим общением, навык грамотно доносить свою точку зрения теряется естественным образом. Друзья и близкие зачастую воспринимают нас “как есть”, исключая обратную связь для сохранения отношений. Несмотря на лояльность друзей и коллег, практика публичных выступлений важна и необходима для поддержания способности передавать свои мысли и чувства.
Данное исследование поможет разобраться с нашими вербальными привычками и подсветит зоны роста. К её созданию меня подтолкнул спикер одного из youtube каналов it-направленности. Его речь, наполненная идиомами и вводными словами, мешала восприятию основного полезного контента. Впоследствии родилась идея перевести аудиозаписи роликов в текст и выяснить, какие выражения чаще других перегружают речь. Первой задачей стала транскрибация целевой аудиодорожки, второй – анализ текста, третьей - выводы и работа над ошибками.
Детали исследования с полным кодом я выложил на GitHub.
Транскрибация
Поиск качественного инструмента для анализа аудио свелся к выбору между облачными сервисами. Решения, доступные 'for free' в открытых репозиториях не соответствовали моим ожиданиям по качеству результата. Адекватное решение, способное обрабатывать длинные записи, нашлось только у тындекса. После нетривиальных настроек облака стал доступен API асинхронного распознавания. Настройки сервиса описаны здесь: cloud.yandex.ru/docs/speechkit/. Для теста была записана аудиодорожка с моими впечатлениями за текущий год. Далее в коде используется именно она.
Обработка mp3-файла
Подключаемся к cloud.yandex.ru , проходим все стартовые настройки сервера и рабочего пространства.
Заливаем аудиозапись в выделенное хранилище облака, назначаем права на чтение сервису Speech_Kit, копируем ссылку на файл, вставляем её в POST-запрос:
Запрашиваем на сервере статус операции раз в 10 секунд и ожидаем окончания процесса распознавания:
Переводим весь текст в нижний регистр, чистим от знаков пунктуации:
Анализ текста
Ищем уникальные идиомы из двух слов, не подпадающие под стандартные речевые обороты:
Считаем количество повторений пар из 2 слов в тексте:
Объединяем результаты и оставляем уникальные:
Промежуточные выводы:
Если мы ищем конкретные речевые обороты, можно упростить процесс перебора, задав их в явном виде:
Создаем словарь повторений выбранных фраз в тексте:
Считаем повторения слов-паразитов в тексте:
Считаем количество повторений отдельных слов в тексте:
Находим самую "вредную" фразу из всего текста, даем рекомендации:
Историческое отступление. Стив Джобс
Давайте немного отвлечемся и для проверки работы скрипта возьмем текст презентации компании Apple 2007 года, где исполнительный директор анонсировал первый мобильный телефон компании с сенсорным дисплеем и функцией геолокации. Анализ текста позволит нам понять, какие фразы Стив Джобс использовал для представления своего нового творения общественности.
Для упрощения процесса загружаем речь спискеров с сайта https://singjupost.com/ по ссылке: https://singjupost.com/wp-content/uploads/2014/07/Steve-Jobs-iPhone-2007-Presentation-Full-Transcript.pdf
Оставляем только речь Стива:
Разбиваем текст на пары рядом стоящих слов:
Считаем количество повторений пар слов:
Из приведенного результата видно, что речь Cтива наполнена фразами про намерение, желание и простоту. Этот посыл передается аудитории и то, как он вдохновленно рассказывает о новом устройстве и то, как умело использует его в своих руках. Любой человек подсознательно проникнется такой подачей.
Подводя итог, можно сказать, что речь - сильный инструмент, способный убеждать, если вы используете верные слова и честны с аудиторией.
Данное исследование позволяет легко проанализировать аудиозапись или готовый текст. Получив самые популярные фразы в речи, можно понять на сколько они ценны или наоборот бесполезны. Проанализировав результаты, можно улучшить качество высказываний для нашего слушателя, а значит стать приятным собеседником или успешным спикером.