Модель распознавания, которая используется в Салют ТВ, состоит из двух частей: акустической и языковой. Акустическая модель отвечает за то, чтобы правильно слышать буквы в словах, которые произносит пользователь. Чтобы делать её лучше, надо регулярно обогащать её новыми данными — верно транскрибированными аудиозаписями. Сначала мы собираем их с помощью краудсорсинга. Просим русскоязычных толокеров наговорить заранее подготовленные запросы, а затем проверяем, совпадает ли распознанный запрос с исходным текстом. Помимо этого, мы размечаем (транскрибируем) записи из реального потока пользовательских запросов — это основной способ улучшения модели. Таким образом — наговариванием и разметкой — мы набираем около 100 тысяч запросов в месяц.
Слушание и распознавание реплик пользователя включается только тогда, когда вы нажимаете кнопку Салюта на пульте. Без вашей команды никакого слушания не происходит.
Зная Сбер, я не буду удивлен если они завтра все просто не забросят. А деньги за умный софт в телевизоре Вам не вернут ...
В общем по мне телевизор должен быть простой. Просто монитор. А потом я к нему или ТВ Бох подключу или просто ноутбук и буду смотреть все что захочу.