OpenAI выпустила Realtime API и новую голосовую модель

Realtime API теперь доступен для всех разработчиков. С его помощью делать голосовых агентов. API поддерживает MCP, загрузку изображений и звонки по протоколу SIP. Еще в Realtime API появилось два новых голоса.

Также вышла gpt-realtime — самая продвинутая модель OpenAI для распознавания речи. В компании говорят, что она лучше следует командам разработчиков и выполняет сложные инструкции.

Попробовать gpt-realtime можно тут, если у вас добавлен способ оплаты https://platform.openai.com/audio/realtime

Подписывайтесь на Telegram GPT/ChatGPT/AI Central Александра Горного.