Google представила TranslateGemma — набор открытых моделей для перевода текста на 55 языков
Они доступны через платформу Vertex AI и на Hugging Face.
- Всего Google выпустила три модели TranslateGemma — на 4 млрд, 12 млрд и 27 млрд параметров. Первая оптимизирована для запуска на мобильных устройствах, вторая — для ноутбуков, третья может работать на одном графическом процессоре H100 или TPU.
- Модель на 12 млрд параметров в собственных тестах Google превосходит базовую версию Gemma 3 на 27 млрд параметров. Разработчики смогли «значительно» снизить количество ошибок на всех языках, утверждает компания.
Частота ошибок для разных языковых семей
- Для обучения моделей TranslateGemma использовали двухэтапный подход. Сначала доработали базовые модели Gemma 3 на разных наборах данных — текстах, переведённых человеком, и «высококачественных синтетических переводах», сгенерированных моделями Gemini. Затем применяли обучение с подкреплением, чтобы добиться более точных и естественно звучащих переводов.
- Модели TranslateGemma поддерживают в том числе русский язык. Протестировать их можно на платформе Vertex AI. Их также можно скачать на Hugging Face и Kaggle.
- Google выпустила открытую модель Gemma 3 для работы «на одном графическом процессоре» в марте 2025 года. Летом того же года компания представила «ультракомпактную» модель Gemma 3, которую можно запустить на смартфоне.
28 комментариев