Мы со Smart Engines обучили ИИ видеть скрытые пространства и запатентовали технологию в США

Мы получили американский патент на нашу фирменную разработку. Наша команда Smart Engines предложила использовать преобразования Хафа в качестве слоев нейронной сети, благодаря чему нейросети – при снижении числа обучающих параметров в 100 раз – значительно лучше справляются с базовыми задачами компьютерного зрения. Теперь ИИ может легко обнаруживать частично заслоненные объекты и достраивать их форму. Это шестой патент США, который мы получили за год. Рассказываем, как это работает.

Запатентованная учеными Smart Engines нейросетевая архитектура объединяет блоки, используемые в нейросетях, с классическим инструментом анализа изображений реального мира – преобразованием Хафа. Эти два механизма дополняют друг друга. Хаф-анализ часто используется для поиска и выделения прямых, таких как строки текста или границы объектов — дорог, домов, документов. А сверточные слои нейросети в свою очередь помогают решить задачу классификации обнаруженных отрезков.

Иллюстрация работы Хафовских нейросетей
Иллюстрация работы Хафовских нейросетей

“Механизм работы выглядит так. Первый блок сверточных слоев нейросети строит локальные признаки точек изображения. Затем преобразование Хафа интегрирует значения локальных признаков вдоль прямых, в результате чего появляется возможность посчитать сложные нелинейные статистики – например, дисперсию. Сверточные слои после преобразования Хафа работают с этими статистиками вдоль прямых. Следующий этап – транспонирование, после чего происходит переход карт признаков в исходные координаты. На последнем этапе полученный результат обрабатывается еще одним блоком сверточных слоев, в результате чего мы получаем изображение в исходных координатах, но в каждой его точке накоплена информация со всего изображения, – комментирует руководитель отдела машинного обучения Smart Engines, к.т.н. Александр Шешкус.

Хафовские нейросети могут гораздо лучше справляться с задачей поиска точек схода, определения форм и выделения контуров объектов, а также лучше детектируют протяженные или частично заслоненные объекты.

Важным аспектом данного изобретения является то, что полученные нейросетевые архитектуры более устойчивы к широкому спектру атак на ИИ. Так, даже замещение части изображения не станет препятствием для обнаружения объекта. Например, если на изображении с дорогой точка схода случайно или намеренно заслонена каким-то объектом — Хафовская нейронная сеть все равно ее найдет.

Нередко точка схода может быть перекрыта посторонними объектами – рекламными щитами, другими автомобилями, грузовиками и т.д.
Нередко точка схода может быть перекрыта посторонними объектами – рекламными щитами, другими автомобилями, грузовиками и т.д.

Если край документа на входящем изображении перекрыт пальцем – искусственный интеллект, зная форму документа, сможет легко ее восстановить.

Мы со Smart Engines обучили ИИ видеть скрытые пространства и запатентовали технологию в США

Это изобретение мы запатентовали в США, получив таким образом уже шестой американский патент на наши разработки в 2023 году. В общей сложности – уже седьмой.

Ранее мы получили патенты США на ряд наших ключевых изобретений – метод идентификации документов, метод интеграции кадров в видеопотоке, метод остановки распознавания текста в видеопотоке и метод использования преобразования Хафа в сетях. Еще один патент компания получила на ключевое изобретение в сфере компьютерной томографии. Запатентованные решения уже используются в программных продуктах компании Smart Engines для автономного распознавания паспортов, ID-карт и других документов.

33
5 комментариев

Если кто-то другой будет использовать "ваш" подход в своей работе , или самостоятельно , своим трудом и время потерей , дойдёт до подобного метода обработки сигналов и неведуя по естественным причинам собственного физического ограничения (человек ведь не может всё знать на свете) будет использовать в своей работе принося вам условный убыток , что вы будете делать? Как будете защищать свою разработку? Ведь идея экстракции особенностей (features extraction) и использования полученных данных уже, не нова , (например при работе со звуком используют Быстрое преобразование Фурье FFT , затем преобразование в MEL спектрограммы , которые в свою очередь используются нейронными сетями) являются в сути своей свободной математической моделью , на что именно вы получили патент и что защищаете?

Ответить

Не подумайте что я придираюсь , вы молодцы , время потрачено не зря , просто интересно как решаются такие дела , были ли прецеденты ранее :)

1
Ответить

Будем защищать свои права в разумных пределах. Если это будут исследователи/ученые, то они должны сослаться (это нормальная практика делать ссылки на предшествующие работы) и описать, что нового по сравнению с нами они придумали. Если это будут корпорации, то компенсировать убыток и принести прибыль или договориться о чем-то, например, о кросс-лицензировании чего-то нужного нам. В общем-то для этого и защищается интеллектуальная собственность.

Ответить

Молодцы! А почему именно США , а не Российской Федерации?

Ответить

Добрый день!

Большое спасибо за интерес к нашим разработкам! В России уже запатентовали)

По законам РФ россияне обязаны сначала подать заявку на патент в России, а только после этого можно подавать зарубеж. В США патентуемся, поскольку это очень крупный технологический рынок и делаем это для защиты нашей интеллектуальной собственности и интересов.

Ответить