Автоматический перевод текста, HTML, файлов без ограничений на 100 языков для ваших проектов. Офлайн. API, сервер, SDK

Я занимаюсь переводчиками с 2012 года, и эта тема выбрана не случайно. Еще тогда было замечено, насколько сильно переводы могут влиять на показатели бизнеса. В нашем случае поддержка всего 15 языков вместо одного позволила увеличить количество скачиваний мобильных приложений до 35 миллионов без затрат на рекламу. Никакие другие действия не давали такой пользы с учетом потраченного времени и денег. И это стало основной причиной того, почему я выбрал это направление.

Несмотря на глобализацию, проблема языкового барьера до сих пор актуальна. В мире насчитывается более 7 тысяч языков, на которых общаются более 7 миллиардов жителей. По статистике, каждый год более 1 миллиарда человек ищут в интернете решения, связанные с переводами.

Каждый день увеличивается количество данных на разных языках. Доля английского языка в интернете сократилась до 25% в последние годы.

· Согласно недавнему опросу в восьми странах, более 72% потребителей заявили, что у них больше шансов совершить покупку на веб-сайте, если он будет на их родном языке.

· 42% потребителей Европейского Союза не покупают товары или услуги, представленные на иностранном языке, даже если они свободно говорят на этом языке.

· Компании, которые локализовали свой контент, в 2,5 раза чаще испытывают рост прибыли в годовом исчислении и в 1,8 раза чаще испытывают рост доходов.

· Для предприятий, локализовавших информацию, предназначенную для коммуникации с клиентами и партнерами, увеличение выручки было в 2,67 раза более вероятным, а рост прибыли — в 2,6 раза более вероятным.

Если рассмотреть пример конкретного кейса, то можно привести в пример компанию Hubspot. Они перевели текст коммерческого предложения, потратив $1500, что привело к увеличению ежегодной выручки на $144 000 от этой рекламной кампании.

Развитие машинного перевода

Любому международному бизнесу нужна функция перевода в том или ином виде. Это может быть перевод документов, сайта, многоязыковая поддержка клиентов, анализ конкурентов и другое. Несмотря на огромный спрос на переводы, использование человеского труда для этой задачи стоит дорого и занимает много времени. Поэтому, как только появились компьютеры, их сразу начали использовать для решения проблемы языкового барьера.

Постоянное улучшение качества машинного перевода позволило во много раз сократить затраты на перевод человеком, ведь в переводах основной расход - это зарплата людей, которые владеют иностранными языками. Чем лучше переводит компьютер, тем меньше времени человеку нужно исправлять за ним ошибки. Развитие технологий уже сейчас позволило в некоторых случаях полностью заменить человеческий перевод машинным.

Например, 1 сентября 2020 года ведущий мировой научный журнал Nature опубликовал сообщение о том, что машинный перевод уже достиг качества человеческого в англо-чешских новостях.

Долгое время рынок машинного перевода делили корпорации, например, Google, Microsoft, Яндекс. У них было больше возможностей собрать огромные наборы данных, нанять ученых, а также позволить себе суперкомпьютер для их обработки.

Еще несколько лет назад у стартапов не было шансов сравниться по качеству перевода с лидерами, но постепенно все менялось. ,

Появление открытих платформ для нейронных сетей, бесплатных датасетов, супер-производительных компьютеров, доступных для малого бизнеса, поменяло правила игры. Если раньше для создания качественного переводчика нужен был компьютер размером с большой дом, то уже через 2 года с теми же характеристиками он стал помещаться в тумбочке.

В переводческий рынок стали включаться небольшие компании, и 2016 году одним из таких стартапов стал наш Lingvаnex.

Потратив четыре года на разработку и исследования, наша команда добилась качественного перевода на более чем сто языков с функциями перевода текста, голоса, файлов, сайтов. И теперь мы стали предлагать решения для бизнеса.

Машинный перевод будет полезен везде, где много контента. А также как дополнительная функция для сервисов. Это может быть:

* Интернет-магазины, новостные сайты, каталоги, энциклопедии, форумы, сервисы вопросов и ответов, отзывов и др.

* Инструменты для продаж. Лидогенерация. Рассылки email.

* Поисковая оптимизация (SEO). Cоздания зарубежных версий сайтов на других языках и сбора дополнительного трафика. 200 000 HTML страниц в 5000 символов каждая переводятся за сутки на 1 видеокарте типа RTX 3090.

* Бизнес-аналитика. Парсеры. Сбор данных на других языках, последующий перевод и анализ.

* Чаты, чат-боты, сервисы поддержки.

* Как дополнительная функция к сервисам. Например для CRM, документооборот

В чем отличие от Google переводчика

Если вы студент или турист и вам нужно перевести небольшую статью для личных целей, то можно использовать бесплатные сервисы типа Google или Microsoft. Но если вы компания, то переводить письма клиентов, накладные, справки и прочие внутренние документы через бесплатные онлайн-сервисы может быть небезопасно, так как такие компании собирают ваши данные, чтобы потом продать их рекламодателям. Кроме того, переводы больших объемов текста через Google API будут стоить очень дорого.

Для таких случаев Lingvanex предоставляет возможность устанавливать переводчик в корпоративную сеть и переводить без доступа в интернет большие объемы данных. Причем все происходит очень быстро и с сохранением форматирования. Кроме того, линейка решений Lingvanex покрывает много кейсов интеграции перевода в бизнес процессы. Во всех продуктах доступны все языки, что есть у Google.

Облачное API

Для подключения нужен доступ в интернет, чтобы быстро интегрироваться с вашими сервисами. Стоимость Lingvanex API для перевода составляет от $3 за миллион символов, при том же количестве языков и сопоставимом качестве, что у Google. Цена зависит от объема. По умолчанию цена 5$ за миллион символов, что в 4 раза дешевле Google.

Сервер

Если запросы на перевод составлят от 200 миллионов символов в месяц или нужна конфиденциальность, то выгодней взять сервер переводов, чтобы переводить без ограничений и экономить деньги. Можно переводить миллиарды символов в день по фиксированной цене. Используя сервер, ваши данные остаются у вас. Их не нужно отправлять третьим лицам. Для работы сервера нужна операционная система Ubuntu. Работает через REST API и легко интегрируется в ваши SaaS сервисы.

Доступна бесплатная демо-версия сервера на 1 неделю.

Сервер может переводить текст, HTML (вебсайты) и файлы с сохранением форматирования на 120 языков, а также конвертировать голос в текст с 18 языков.

Для работы нужна видеокарта от Nvidia типа Geforce GTX и новее, процессор от 4 ядер, 16GB оперативной памяти и от 100GB на диске. Сервер можно использовать без видеокарты, на CPU, но тогда скорость перевода будет в 10 раз медленнее. Скорость перевода на базе одной видеокарты Nvidia T4 составляет 20 000 символов в секунду.

Если нужно, наша техническая команда поможет развернуть переводчик на вашем сервере. Устанавливается в течение 2 часов.

Цена начинается от 3000 евро в год и формируется в зависимости от количества языков и функций (текст, HTML, файлы, транскрипция голоса). Для больших объемов перевода это лучший вариант по цене (из расчета от 250 евро / месяц).

SDK

Позволяет встроить функцию перевода в приложения на iOS, Android, Windows и Mac OS. Представляет собой статическую библиотеку, которую можно подключить в исходный код ваших проектов. Переводит без интернета с небольшими по размеру файлами языков. Доступно 100 языков. Подойдет для приватных мессенджеров, браузеров, юридических и медицинских и других программ, где нужна защита данных. Цена за SDK начинается от 1500 евро в год.

Desktop приложения

Переводят текст и файлы офлайн под Windows и Mac OS. Устанавливаются на каждый компьютер отдельно. Подойдет для корпоративной сети, где нет доступа в интернет. Цена от 200 евро в год за лицензию на 1 компьютер.

Узнать больше про решения для перевода и проверить качество перевода можно здесь:

Или пишите на info@lingvanex.com

77
21 комментарий

Решил протестить работу переводчика, сравнивая с Google.
Взял первую рандомную новость, рандомный абзац.
Перевод от Google меня, в целом, устраивает. Кроме "Центров по контролю". Правда здесь запнулись оба сервиса.
В то же время к переводу от Lingvanex у меня есть вопросы:
"руководство по маске",
"хорошо прилегающую маску",
"носить последовательно".
Во всех случаях Google лучше работал с контекстом предложения, что видно по более адекватным результатам перевода. Перевод в этих местах от Lingvanex больше похож на подстрочник.

У вас действительно в 4 раза меньше цена, но если перевод нужен не на потоке в несколько сотен миллионов/месяц, то я бы лучше заплатил $20 и получил более качественный перевод, если я бизнес и мне нужно переводить до 1 млн в месяц.

Плюс, Google дает 300 бесплатных кредитов и если не выходить за рамки 500к в месяц, можно использовать API бесплатно на протяжении 30 месяцев (10 кредитов/месяц).

Deepl всё равно круче переводит, потому что у них не машинный, а нейронный перевод

3

Я до сих пор удивляюсь как многомиллионные компании не могут потратить деньги чтобы локализировать свой продукты на большое количество языков.
Это жи привлечет больше людей к их продуктам.
Максимум что есть, это 10-15 языков.

1

Перевод онлайн-сервиса - это не одноразовая трата, а постоянная поддержка, потому что сервис развивается. Поэтому зачастую перевод просто не оправдывает затраты.

Все зависит от задачи. Если нужно максимальное качество перевода для небольших текстов - то Google будет лучше.

Но если надо переводить большие объемы текста (от миллиарда символов в месяц) и защитой ваших данных, то лучше использовать локальный сервер перевода от Lingvanex.

1

"Доля английского языка в интернете сократилась до 3% в последние годы"

А это откуда такая инфа? Ну ок, Китай, Индию и каких-нибудь азиатов выкидываем, пусть это будет 50%.

Короче, сомнительно, что в этих ваших интернетах на английском всего 3%.