Улыбаемся и машем: как и зачем наши ученые сгенерировали больше 1000 документов со счастливыми лицами?

Хвастаемся крупнейшим датасетом ID-документов и другими научными достижениями

В нашей компании 30% сотрудников являются счастливыми обладателями ученых степеней кандидата и доктора наук, а остальные – к этому стремятся. Поэтому по окончании каждого года мы традиционно подводим итоги не только нашей коммерческой деятельности, но и научной работы.

За 2022 г. сотрудники Smart Engines подготовили 65 научных работ – это на 20% больше, чем в 2021 г.. Из них:

– 13 были представлены докладами на конференциях в области ИИ, компьютерного зрения и обработки изображений;

– 20 были напечатаны в сборниках конференций;

– 32 были опубликованы в самых престижных научных журналах. Они индексируются крупнейшими в мире базами данных научных статей Web of Science (WoS) и Scopus.

Нужно уточнить, что среди индексируемых научных журналов есть те, которые считаются особенно престижными — журналы Q1, первого квартиля. Они пользуются большей популярностью и обладают наивысшим уровнем цитируемости. В таких журналах мы за прошлый год выпустили 10 статей.

Некоторые из этих научных публикаций создали заметный резонанс в СМИ и соцсетях. О них мы и расскажем далее.

Наши специалисты по искусственному интеллекту совместно с коллегами из России, Италии и Германии в своей статье в журнале Tomography рассказали, как первыми в мире построили 3D-модель обонятельной луковицы человека. Это небольшой (около 0,5 см) участок мозга, имеющий сложную слоистую структуру. До недавнего времени эта и подобные ей микроструктуры мозга исследовались либо в низком разрешении методом МРТ, либо с разрушением образца по результатам гистологии.

<i>Фотография человеческого мозга. Красным цветом обозначены обонятельные луковицы, фиолетовым – обонятельный тракт</i>

Теперь же коллективу ученых и специалистов по искусственному интеллекту удалось построить 3D-модель обонятельной луковицы в высоком разрешении без разрушения образца. Результаты эксперимента помогут в исследованиях нейродегенеративных состояний и в установлении причин ухудшения обоняния при коронавирусе COVID-19.

В журнале Mathematics мы рассказали о том, как нейронные сети могут вводить в заблуждение врачей при диагностировании заболеваний с помощью томографических снимков.

В отдельных случаях искусственный интеллект может дорисовывать на снимках несуществующие опухоли, ложные поражения в результате COVID-19 и другие ошибочные признаки заболеваний. И наши ученые предложили новый метод оценки устойчивости нейросетей к подобному “обману”.

Стрелкой показана опухоль, которую необходимо обнаружить врачу для правильной постановки диагноза. На правом изображении из-за шума опухоль становится слабо различимой, и поставить правильный диагноз по такому изображению будет затруднительно

Другими словами, мы создали инструмент, который перед непосредственным применением нейросетей позволяет их оценить и выбрать наилучшую, наиболее подходящую для реального использования. Это важный шаг на пути к внедрению нейросетей в медицину, которая, будучи весьма консервативной, пока с недоверием и опаской смотрит на инструменты машинного обучения.

В 2022 году исследователи Smart Engines опубликовали статью в журнале Computer Optics, описывающую уникальный датасет MIDV-2020 для машинного обучения. Это крупнейший общедоступный набор данных. Он включает в себя 1000 искусственно созданных ID-документов, 2000 сканов, 1000 фотографий и 1000 видеоклипов - всего 72 409 размеченных изображений и видеокадров.

Примеры искусственно сгенерированных документов - паспорта Азербайджана и ID-карты Испании

В этой статье мы представили базовые оценки методов анализа ID-документов – обнаружение и определение местоположения, идентификация, распознавание текстовых полей и распознавание лиц. О том, как датасет создавался, мы во всех красках рассказали в нашем блоге на Хабр.

Кстати, один из комментаторов Хабра приметил, что все лица на опубликованных фотографиях выглядели "слишком радостными и красивыми". Еще раз отметим, что мы на это никак не повлияли. Искусственно сгенерированные изображения лиц для каждого документа мы взяли на Generated Photos Service. Для генерации имен и адресов мы использовали открытые базы данных существующих имен (такие как "Википедия") и онлайн‑генераторы адресов/имен.

Это исследование мы провели в сотрудничестве с коллегами из французского университета Ля Рошель.

Мы полагаем, что собранный нашими учеными набор данных ненастоящих документов пригодится для разработки и оценки методов компьютерной экспертизы документов, обнаружения атак и других подходов к проверке подлинности.

В 2021 г. сотрудники Smart Engines написали в совокупности 41 работу, в 2022 г. - уже 65. Smart Engines является в России одной из компаний-лидеров по числу опубликованных сотрудниками научных статей, оценивает CEO Smart Engines к.т.н. Владимир Арлазаров.

Мы рады, что бизнес и наука в нашей компании гармонично сосуществуют и стимулируют взаимное развитие, о чем свидетельствуют финансовые показатели. Именно твердая приверженность принципу Science First (наука на первом месте) позволяет нам постоянно расширять перечень предлагаемых решений и совершенствовать их.
СЕО Smart Engines к.т.н. Владимир Арлазаров

*По мотивам статьи: Meshkov, A.; Khafizov, A.; Buzmakov, A.; Bukreeva, I.; Junemann, O.; Fratini, M.; Cedola, A.; Chukalina, M.; Yamaev, A.; Gigli, G.; Wilde, F.; Longo, E.; Asadchikov, V.; Saveliev, S.; Nikolaev, D. Deep Learning-Based Segmentation of Post-Mortem Human’s Olfactory Bulb Structures in X-ray Phase-Contrast Tomography. Tomography 2022, 8, 1854-1868. https://doi.org/10.3390/tomography8040156

**По мотивам статьи: Smolin, A.; Yamaev, A.; Ingacheva, A.; Shevtsova, T.; Polevoy, D.; Chukalina, M.; Nikolaev, D.; Arlazarov, V. Reprojection-Based Numerical Measure of Robustness for CT Reconstruction Neural Network Algorithms. Mathematics 2022, 10, 4210. https://doi.org/10.3390/math10224210

***По мотивам статьи: K.B. Bulatov; E.V. Emelianova; D.V. Tropin; N.S. Skoryukina; Y.S. Chernyshova; A.V. Sheshkus; S.A. Usilin; Z. Ming; J.-C. Burie; M. M. Luqman; V.V. Arlazarov; MIDV-2020: a comprehensive benchmark dataset for identity document analysis. Computer Optics 2022, Vol. 46 (2), DOI: 10.18287/2412-6179-CO-1006

Улыбаемся и машем: как и зачем наши ученые сгенерировали больше 1000 документов со счастливыми лицами?

Мы обучили нейросети распознавать многослойные микроструктуры человеческого мозга*

Мы продемонстрировали, как нейросети могут вводить в заблуждение врачей**

Мы создали крупнейший датасет документов, удостоверяющих личность***

Мы находимся в числе компаний-лидеров по научной работе