Новый стандарт озвучки в Gemini 3.1 Flash TTS
Google выпустила Gemini 3.1 Flash TTS — модель преобразования текста в речь, которая избавляет ИИ от «роботизированного» звучания.
Главные фишки:
— Управление эмоциями: Теперь можно вставлять в текст теги на естественном языке, чтобы ИИ сменил тон, темп или добавил нужную эмоцию в конкретном месте.
— Диалоги: Модель поддерживает естественную беседу нескольких персонажей в рамках одного аудиофайла.
— 70+ языков: Масштабное покрытие с высокой плавностью речи.
— SynthID: Автоматическое вшивание невидимых водяных знаков для защиты от дипфейков и подтверждения того, что звук создан нейросетью.
Это быстрое и бюджетное решение для качественной озвучки видео, приложений и подкастов прямо через API или Google AI Studio.
Подписывайтесь на Telegram Ринат Шакиров | Промпты для Midjourney | ChatGPT |.