Новый стандарт озвучки в Gemini 3.1 Flash TTS

Google выпустила Gemini 3.1 Flash TTS — модель преобразования текста в речь, которая избавляет ИИ от «роботизированного» звучания.

Главные фишки:

— Управление эмоциями: Теперь можно вставлять в текст теги на естественном языке, чтобы ИИ сменил тон, темп или добавил нужную эмоцию в конкретном месте.

— Диалоги: Модель поддерживает естественную беседу нескольких персонажей в рамках одного аудиофайла.

— 70+ языков: Масштабное покрытие с высокой плавностью речи.

— SynthID: Автоматическое вшивание невидимых водяных знаков для защиты от дипфейков и подтверждения того, что звук создан нейросетью.

Это быстрое и бюджетное решение для качественной озвучки видео, приложений и подкастов прямо через API или Google AI Studio.

Начать дискуссию