Привет! Меня зовут Никита Ткачев, в Yandex.Cloud я занимаюсь развитием ML-сервисов. В этой статье расскажу, как для речевой аналитики клиентов мы совершенствуем технологии автоматического распознавания речи, которые позволяют нашим пользователям транскрибировать звонок с минимальной задержкой и с точностью до 97%.
Военные-мвдшные технологии на службу бизнеса))
В целом тема крутая. Интересно было бы узнать, как алгоритмы работают со смешенными диалектами.
Пример - татары очень быстро разговаривают и смешивают русские слова с татарскими. Получается конструктив типа "раствор ёк, суши вёсла. Кайда купить"?)))
У нас в языке довольно много заимствований, поэтому в общем случае получится примерно описанная вами ситуация, за исключением моментов где есть сильно более употребляемые паронимы, но понимая контекст не очень сложно делать нормализацию в процессе аналитики.