OpenAI запускает реалистичный голос в Chat GPT 4o

OpenAI запускает реалистичный голос в Chat GPT 4o

Когда OpenAI впервые продемонстрировала голос GPT-4o в мае, аудитория была потрясена реалистичностью и скоростью ответов. Эта функция напоминала голос Скарлетт Йоханссон, известной актрисы, которая сыграла искусственного помощника в фильме «Она». Это сходство вызвало волну дискуссий, а также привело к юридическим проблемам для OpenAI. Давайте рассмотрим, как OpenAI справляется с этими вызовами и что ожидает пользователей в будущем.

Появление и удаление голоса Sky

После демонстрации OpenAI, Скарлетт Йоханссон заявила, что она не давала разрешение генеральному директору Сэму Альтману на использование ее голоса. Актриса была настолько обеспокоена сходством, что наняла адвоката для защиты своих прав. Несмотря на отрицание OpenAI использования ее голоса, компания удалила голос Sky из демоверсии и отложила выпуск Advanced Voice Mode для улучшения мер безопасности.

OpenAI подтвердила, что возможности видео и обмена экранами, продемонстрированные весной, не будут включены в альфа-версию и появятся позже. Хотя демонстрация GPT-4o произвела впечатление на всех, она пока остается недоступной для широкой публики, за исключением некоторых премиум-пользователей, которые теперь могут опробовать голосовой режим ChatGPT. OpenAI утверждает, что расширенный голосовой режим будет значительно отличаться от предыдущего.

Технологические новшества GPT-4o

Ранее ChatGPT использовал три отдельные модели для обработки звука:

  • Преобразование голоса в текст,
  • Обработка текста моделью GPT-4,
  • Преобразование текста в голос.

С новым мультимодальным GPT-4o все эти задачи выполняются без вспомогательных моделей, что значительно сокращает задержки в разговоре. OpenAI также утверждает, что GPT-4o способен чувствовать эмоциональные интонации, такие как грусть или волнение, что делает его более человечным.

В рамках пилотного проекта пользователи ChatGPT Plus смогут убедиться в гиперреалистичности нового голосового режима OpenAI. OpenAI планирует постепенно внедрять новый голос, чтобы следить за его использованием и предотвратить возможные злоупотребления. Пользователи альфа-группы получат уведомления в приложении и инструкции по использованию нового голосового режима.

11
Начать дискуссию