Как выглядит работа приложения? Вы загружаете аудио- или видеозапись, а на выходе получаете JSON (структурированные данные в виде текста) с результатами распознавания речи по дикторам/каналам и с результатами анализа распознанного текста: сегментацию диалога по тематикам, анализ эмоций, выделение именованных сущностей (например, выделение наименований организаций, местоположения, время, персоны). Выделяется 29 классов именованных сущностей. И для всего текста автоматически проставляются заголовки.