Здесь на vc.ru я уже рассказывал о своем боте, в который я запихнул сразу кучу нейросетей: распознавание, понимание смысла, перевод и озвучивание. И это на двух языках. На каком бы языке ты не говорил, бот тебя понимает.
api whisper и chatgpt?
В том числе. Там ещё гугловская озвучка, перевод уже не помню от кого и wit.ai для поиска смысла и местами распознавалка