Google выпустил генератор речи на базе Gemini 2.5 Flash Preview TTS
Google запустил новый инструмент для генерации речи - Gemini Speech, который использует модель Gemini 2.5 Flash Preview TTS . Этот инструмент позволяет создавать высококачественную озвучку текста с возможностью точной настройки акцентов и интонаций.
Gemini Speech - это мощный генератор речи, который преобразует текст в естественно звучащую речь. Он идеально подходит для создания диалогов, подкастов, аудиокниг и других проектов, где важно качество голоса.
Библиотека из 30 голосов
- Голоса настолько реалистичны, что могут составить конкуренцию профессиональным дикторам с радио и ТВ.
Поддержка 24 языков
- Включая русский, что делает инструмент доступным для международной аудитории.
Многоголосие для диалогов
- Вы можете выбрать несколько спикеров для создания диалогов или подкастов.
Бесплатный доступ
- Инструмент доступен для тестирования в AI Studio .
Голоса настолько естественные, что их сложно отличить от человеческой речи.
Не отставайте от технологий! Подписывайтесь на Telegram-канал, чтобы быть в курсе последних трендов и лайфхаков.
Начать дискуссию