Миссия невыполнима? Машинный перевод – секретное оружие патентных экспертов

«Патентная система добавила масла заинтересованности в огонь гениальности» - Авраам Линкольн

США, 1793 год. На южных плантациях выращивают хлопок двух сортов: у одного семена очень легко отделяются от волокон, но он растет только на побережье, у другого – с большим трудом, но растет он на возвышенности. Перед плантаторами стоит нелегкая задача – изобрести способ, который позволил бы с легкостью очищать хлопок, растущий в горах.

В одном из американских поместий трудится механик Элли Уитни – именно ему поручают придумать такой способ. И он придумал. Как гласит легенда, Уитни наблюдал за кошкой, которая пыталась ухватить цыпленка когтями, но потенциальная добыча прогуливалась за проволочной изгородью, и хищнице достался лишь клочок пуха.

Созданный Уитни барабан с зубьями, которые отделяли семена хлопка от волокон, действительно помог американским фермерам XVIII века. С его помощью производительность одного рабочего выросла в 25 раз: за день он мог получить не менее 50 фунтов очищенного хлопка. Но работа гениального механика на этом не закончилась – чтобы изобретение приносило еще больше выгоды, нужно было наладить его производство, а перед этим запатентовать.

С этой целью Уитни отправился в Филадельфию – в те времена именно там находилась столица. Тогда в США патенты выдавало не отдельное ведомство, а Государственный департамент. Изобретатель заплатил пошлину, которая составила 30 долларов, и подал заявку на патент. Ее должен был одобрить госсекретарь. 14 марта 1794 года Элли Уитни получил заветный патент.

Патентная система: первые ведомства

История Элли Уитни показывает, насколько простой в те времена была система патентования. Но всего за 100 лет ситуация изменилась: патенты начало выдавать отдельное бюро, а заявок становилось все больше и больше. В 1873 году, во время Международной выставки изобретений, проходившей в Вене, произошло событие, сделавшее патентную систему глобальной. Многие изобретатели из разных стран отказались от участия в экспозиции из-за опасений, что их изобретения будут заимствованы иностранными коллегами. Чтобы избежать неприятных инцидентов, 10 лет спустя в Париже приняли Конвенцию по охране промышленной собственности. Еще через 10 лет, в 1893 году, в швейцарском Берне создали первое всемирное патентное ведомство – Объединенные международные бюро по охране интеллектуальной собственности. Впоследствии это ведомство стало Всемирной организацией интеллектуальной собственности. Тем временем в США патентные заявки поступали в невероятных объемах. Руководитель патентного бюро Чарльз Дьюел даже заявил: «Все, что можно было изобрести, уже изобрели».

Все, что можно было изобрести, уже изобрели

Чарльз Дьюел, Руководитель патентного бюро США

Однако XX век показал, что патентные ведомства необходимы: изобретений и патентных заявок становилось все больше и больше. В начале прошлого столетия только в США штат патентных экспертов составлял тысячи человек, а ведь аналогичные учреждения работали и в других странах. Специалистам приходилось нелегко: нужно было разбираться с огромными объемами документации, выяснять, является ли изобретение уникальным, изучать регулярно пополняемую базу данных.

Сегодня патентная система охватывает весь мир и впечатляет своими масштабами. Каждый год Всемирная организация интеллектуальной собственности регистрирует по 3 млн заявок. Рекордсменами по количеству обращений считают Китай (1,38 млн в 2017 году), США (более 600 тыс. в 2017 году) и Японию (более 300 тыс. в 2017 году).

Миссия невыполнима? Машинный перевод – секретное оружие патентных экспертов

По итогам 2017 года Россия тоже вошла в десятку лидеров – наша страна расположилась на восьмом месте с результатом в 36 тыс. патентных заявок. За обработку обращений, поступающих от изобретателей, отвечает Федеральный институт промышленной собственности (ФИПС). Всего за полтора года – этот срок установлен законодательством – специалистам необходимо понять суть изобретения, а затем проверить по базам данных, действительно ли это изобретение уникально. Учитывая, что поиск приходится вести в базах международных патентных ведомств (Европейское патентное ведомство, Патентные ведомства Японии, США, Кореи и Китая), то есть, не только на русском, но и на других языках, их миссию можно назвать практически невыполнимой.

Чем занимается патентный эксперт?

Патентные эксперты – специалисты высокой квалификации, «золотой фонд» патентных ведомств. Они умеют работать с трудной для понимания и очень объемной информацией, оперативно и дотошно вникают в суть изобретения, проводят поиск по базам данных, сопоставляют найденную информацию с изучаемой заявкой. Стать патентным экспертом непросто. Сначала кандидаты сдают экзамен на квалификацию, к которому допускаются граждане от 18 лет с высшим образованием, а также опытом работы в той или иной предметной области не менее четырех лет. Затем им присваивается статус патентного поверенного, который может заниматься частной практикой или устроиться на работу в ведомство.

Патентные эксперты, как правило, владеют английским и могут знакомиться с патентной документацией на этом языке. Но и этого бывает недостаточно, потому что нужно работать с большими объемами информации, и, зачастую, не только на английском. Ситуацию осложняет узкая специфика изучаемой информации. Чтобы работать оперативно, у экспертов должна быть возможность быстро понимать техническое содержание любого, даже очень сложного по содержанию документа. Поэтому перевод в патентной системе очень важен, он затрагивает всю «юридическую жизнь» патента: от подачи заявления до его проверки.

Чтобы решить проблему языкового барьера и увеличить скорость работы специалистов, патентные ведомства обратились к технологиям машинного перевода.

Миссия невыполнима? Машинный перевод – секретное оружие патентных экспертов

Машинный перевод: европейский опыт

В Европе вопросами интеллектуальной собственности занимается Европейское патентное ведомство (ЕПВ), у которого есть три официальных языка: английский, французский и немецкий. Согласно Лондонскому соглашению, которое вступило в силу в 2008 году, страны, где государственные языки не совпадают с официальными языками ведомства, должны выбрать один из этих языков в качестве предписанного и переводить на них европейские патенты. Только в таком случае патенты могут вступить в силу в этих странах.

Для того, чтобы облегчить работу патентных служб в странах, где английский, французский и немецкий не являются государственными, руководство ЕС задумалось о применении технологий машинного перевода. Эта тема стала центральной на конференции ЕПВ по патентной информации, проходившей в Лозанне в 2010 году. Тогда президент ведомства Бенуа Баттистелли назвал понимание патентов ключевым вопросом. «Нам следует извлекать выгоду от возможностей, предлагаемых сегодняшними технологиями, и внедрять решения по машинному переводу, позволяющие технически квалифицированным специалистам читать патентные документы независимо от их географического происхождения и технического образования», - сказал он.

Нам следует извлекать выгоду от возможностей, предлагаемых сегодняшними технологиями, и внедрять решения по машинному переводу, позволяющие технически квалифицированным специалистам читать патентные документы независимо от их географического происхождения и технического образования

Бенуа Баттистелли, Президент Европейского патентного ведомства

В 2011 году Европейское патентное ведомство создало Patent Translate – сервис на основе технологий машинного перевода, предназначенный специально для перевода патентной документации. Этот сервис поддерживает не только английский, французский и немецкий, но и все официальные языки стран, сотрудничающих с ЕПВ, а также китайский, японский, корейский и русский.

Статистика использования этого сервиса показывает, что каждый день на Patent Translate поступает 15 тысяч запросов на перевод. Причем чаще всего эти запросы поступают из Индии, Японии и США. Так, пользователи получают доступ к патентным данным со всего мира на родном языке и могут быстро обработать большой объем документации.

Машинный перевод: российский опыт

Российское патентное ведомство - Федеральный институт промышленной собственности (ФИПС) – при работе с патентной документацией использует отечественные разработки: за специальным решением, которое поддерживает перевод документов, интегрируется во внутреннюю сеть и обучается на узкоспециализированных данных, ФИПС обратился в компанию PROMT.
Разработчики создали специальную платформу перевода, которая была встроена в инфраструктуру ФИПС. С ее помощью эксперты патентного ведомства переводят документы целиком или фрагменты текстов с описаниями изобретений, могут делать запросы в международной поисковой патентной системе на русском языке – эти запросы переводятся на другие языки автоматически.

Работая с платформой, эксперт использует браузер. Помещая нужный текст в специальное окно на странице, он направляет его на сервер перевода. Сервер возвращает переведенный текст в другое окно, и сотрудник ФИПС одновременно видит текст оригинала и текст перевода. Чаще всего патентные эксперты переводят фрагменты текстов или защищенные файлы в PDF- или JPEG-формате. В среднем за день, по данным PROMT, на платформу поступает 800 запросов на перевод, что составляет почти 2500 страниц текста или 625 тыс. слов.

Конечно, возникает вопрос: насколько высоко качество машинного перевода? Ведь речь идет о работе с текстами узкой тематики, насыщенными специфическими терминами и сложным синтаксисом. В случае с платформой, разработанной для ФИПС, качество и точность перевода достигаются благодаря возможности обучать эту платформу на материалах ведомства – постоянно пополняемых терминологических базах ФИПС. Эксперты ФИПС постоянно создают терминологические базы данных, которые на регулярной основе добавляются в систему перевода.

Возникший несколько лет назад бум нейронных сетей тоже способствует росту качества машинного перевода. Новая технология позволяет добиться невероятных результатов: машинный перевод сопоставим по качеству с переводом, выполненным человеком.

Технологии – будущее патентной системы?

Патентная система изменилась до неузнаваемости: 230 лет назад она была локальной, присутствовала далеко не во всех странах и даже не имела отдельного ведомства (как это было в случае с американским механиком, который получал патент в Госдепартаменте). Сегодня же она играет значительную роль в мировой экономике и охватывает почти все крупные страны.

Мировой охват патентной системы делает работу экспертов не только более значимой, но и более трудоемкой: специалистам приходится работать с колоссальными объемами специфической документации на разных языках, включая азиатские, и без технологий машинного перевода в этой индустрии не обойтись. Постоянно растущее качество машинного перевода – на фоне стремительного развития нейросетевых технологий – еще больше повышает эффективность патентной системы. И, возможно, в ближайшем будущем мы увидим новый виток в развитии этой отрасли, который произойдет благодаря технологиям.

33
1 комментарий

Немного лулзов по теме патентов: https://dtf.ru/gameindustry/131818-novyy-patent-sony-na-vr-ochki

(комменты жгут)