Anton Dvorkovich

+6
с 2017
0 подписчиков
1 подписка

Макс, добрый день! К сожалению, это единственно возможный сценарий на iOS: Apple не позволяет сторонним клавиатурам слушать микрофон (в отличие от системной, которой можно). Из-за этого приходится применять трюк: микрофон слушает не клавиатурный extension, а само приложение Яндекс.Клавиатура.

Надеемся, в следующих версиях iOS появится возможность реализовать ввод голосом без таких ухищрений.

Константин, добрый день! Спасибо за резонную критику в адрес стикеров и гифок :) Мы уже научились корректно отправлять их в основных популярных мессенджерах как настоящие картинки, а не как ссылки (и, если мессенджер позволяет, — без белого фона). Это реализовано в версии приложения Яндекс.Клавиатура 21.1.1, которая сейчас доступна для скачивания части аудитории, а в ближайшие день-два станет доступна всем. А в скором времени эти улучшения появятся и в клавиатуре, встроенной в приложение «Яндекс».

1

Павел, немного не понял вопрос: имеется в виду тренировать наши нейронные движки на чьих-нибудь параллельных корпусах, или использовать наши параллельные корпуса для тренировки чьих-нибудь нейронных движков?
Если первое - то это интересная тема (по сути - адаптация перевода под домен, интересующий владельца корпуса), но прямо сейчас мы таким не занимаемся.
Если второе - то таких планов у нас нет: наши параллельные корпуса - наше богатство :)

Влад, спасибо за вопрос!
Качество перевода измеряется с помощью сравнения переводов тестовых предложений (их обычно несколько тысяч), сделанных машиной, с эталонными, сделанными профессиональными переводчиками. При этом чаще всего используется автоматическая метрика BLEU (https://en.wikipedia.org/wiki/BLEU). Для более точной оценки иногда используют ручные метрики Adequacy & Fluency (clck.ru/BBWhi).
Что касается сравнения с Google Translate - тут всё зависит от направления перевода, о котором мы говорим: в каких-то направлениях мы оказываемся хуже, в каких-то лучше; к тому же, это достаточно быстро меняется со временем, так как над качеством постоянно ведётся работа и у Google, и у нас. Но могу сказать, что в целом для большинства направлений, включающих русский язык, большую часть времени мы впереди :)
А пользовательский фидбек хоть и помогает находить и решать локальные проблемы в переводе, но всё же главными факторами для построения качественного машинного переводчика являются скорее объёмы обучающих данных и алгоритмы обучения.

6