Apple представила функции для создания «копии» своего голоса и озвучки сообщений во время звонков Статьи редакции
Они предназначены для людей с ограниченными возможностями. Компания обещает не собирать голосовые данные пользователей.
- Компания представила функции, которые добавят в предстоящие версии iOS, iPadOS и macOS. Они предназначены для людей с нарушениями зрения, слуха и когнитивных способностей. Функции станут доступны до конца 2023 года.
- На всех устройствах Apple появится функция Live Speech («Живая Речь»). Пользователи смогут набирать текст сообщения во время звонка по Face Time или личного разговора, а система его озвучит.
- Для тех, кто рискует потерять способность разговаривать из-за болезни, будет работать функция Personal Voice («Персональный голос»), которая синтезирует речь на основе голоса пользователя. Для создания «копии» голоса нужно в течение 15 минут зачитывать в микрофон специальные подсказки. Функция работает на основе алгоритмов машинного обучения и интегрируется с «Живой речью»: для озвучивания текста можно будет использовать собственный голос.
- На начальном этапе функция будет работать только с английским языком на устройствах с процессорами Apple. Компания утверждает, что не собирает голосовые данные, а все вычисления производятся локально на устройстве.
- На iPhone и iPad появится режим Assistive Access («Вспомогательный доступ»). В нём доступны только основные функции: камера, сообщения, звонки, фотографии и музыка. Текст и иконки приложений при этом увеличены.
- Инструмент «Лупа», который позволяет использовать камеру как увеличительное стекло и помогает слабовидящим распознавать объекты, получит новые функции. Он также сможет подсказывать значение небольших текстовых обозначений на кнопках — например, в лифте или на микроволновке. Устройство определит текст и прочтёт его вслух. Функция будет доступна в том числе на английском, французском, немецком, испанском, китайском, японском и украинском языках.
26K
показов
9.4K
открытий
Комментарий недоступен
как бы эта ИИ уже есть в открытом доступе на гитхабе, правда она там умеет только в английскую речь
как бы почти всё, что внедряет эпл, было до этого кем-то придумано.
Но широкое распространение многие вещи получают именно с их подачи, потому что там находят адекватные сценарии применения и неплохо допиливают. Те же дактилоскопические сканеры широкое применение в потребительской электронике получили именно с подачки яблочников, хотя до этого не один год существовали
it just works, seamlessly
Поделитесь ссылкой пожалуйста? 😊
https://www.google.com/amp/s/proglib.io/p/golosovoy-deepfake-ili-kak-rabotaet-tehnologiya-klonirovaniya-golosa-2019-12-11/amp/