Voice Engine - Клонирование голоса на основе 15-секундного аудио c ChatGPT

Компания Open AI представила предварительную версию новой модели искусственного интеллекта "Voice Engine", интегрируемой с ChatGPT. В отличие от остальных моделей, она способна c поразительной точностью воссоздать голос, основываясь на аудио длинной всего лишь 15 секунд!

Клонирование голоса за 15 секунд с ChatGPT
Клонирование голоса за 15 секунд с ChatGPT

Где можно применить модель Voice Engine?

  • Перевод видео и аудио подкастов на несколько языков (данная технология уже активно применяется HeyGen);
  • Помощь детям в обучении за счёт взаимодействия с учениками и создания персонализированных ответов в режиме реального времени;

  • Оказание помощи людям с ограниченными возможностями и пациентам имеющими проблемы с речью;

  • Предоставление поддержки по услугам в отдаленных районах.

Дата выхода Voice Engine

Несмотря на анонсирование Voice Engine, Open AI не торопится предоставить открытый доступ к данной модели, поскольку пытаются противостоять её злоупотреблению и использованию в недобросовестных целях.

На данный момент мы решили провести предварительный просмотр, но не выпускать эту технологию в широкое пользование. На основе результатов наших небольших тестов мы примем более взвешенное решение о том, стоит ли внедрять эту технологию в широких масштабах.

Open AI

Компания интенсивно проводит тесты, в тесном сотрудничестве с партнёра для разработки регламента по защите голосов и безопасности применения. В будущем планируется создать надежные меры по аутентификации, такие как проверка голоса, списки защищенных личностей и водяные знаки в целях обеспечения прозрачности и этичности использования Voice Engine.

А вы ждёте выход Voice Engine? Поделитесь в комментариях

33
11
Начать дискуссию