В предыдущих частях (1 часть, 2 часть) мы прошли долгий путь: от оцифровки звука и извлечения признаков до выбора архитектуры, борьбы с шумом, специфичной лексикой и сложностями диаризации. Допустим, мы всё это преодолели. Текст распознан, спикеры разделены. Казалось бы, победа? Не совсем. Теперь перед нами стоит новая, не менее важная задача - пре…