{"id":14284,"url":"\/distributions\/14284\/click?bit=1&hash=82a231c769d1e10ea56c30ae286f090fbb4a445600cfa9e05037db7a74b1dda9","title":"\u041f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0444\u0438\u043d\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435 \u043d\u0430 \u0442\u0430\u043d\u0446\u044b \u0441 \u0441\u043e\u0431\u0430\u043a\u0430\u043c\u0438","buttonText":"","imageUuid":""}

Поиск спрятанной нефти, медицина, страхование и другие возможности компьютерного зрения

Рассказываем о том, как системы компьютерного зрения помогают в разных сферах жизни и бизнесе.

Компьютерное зрение — это методы, с помощью которых машина распознает необходимую информацию из изображений или видео. Информация зависит от поставленной задачи: распознавание людей (лиц или эмоций), поиск специфических объектов, анализ текста, номерных знаков, штрихкодов и многое другое.

Технологии компьютерного зрения разрабатываются с 70-х годов, но для их использования в реальном мире нужна определенная точность распознавания. Для улучшения точности проводят соревнования, к примеру, ImageNet — благодаря им решения на основе сверточных сетей стали основой современного компьютерного зрения.

За последние несколько лет точность стала достаточной для решения практических задач, что существенно повысило интерес бизнеса к технологиям распознавания лиц, речи и эмоций. Сейчас компьютерное зрение используется во множестве корпоративных сфер. Приведем несколько примеров.

1. Социально-экономическая сфера

Компания Orbital Insights занимается анализом спутниковых снимков с социально-экономической стороны. Обработка фотографий происходит с помощью алгоритмов глубокого обучения: программа ищет дома, автомобили, самолеты и другие инфраструктурные объекты.

К примеру, количество автомобилей на стоянке торгового центра сравнивается с выручкой, находится зависимость. Она помогает прогнозировать выручку торгового центра до публикации финансового отчета.

Анализ парковочных мест в торговых центрах

Orbital Insight подсчитала объемы закупленной Китаем нефти и выявила пятикратное расхождение официальных данных и реальных: страна занижает официальные данные по импорту сырья, что может влиять на стоимость барреля нефти.

С помощью машинного обучения китайские резервуары с нефтью обнаруживаются на спутниковых снимках, анализируются другими странами для получения корректных цифр — таким образом регулируется стоимость нефти на рынке.

Вместимость бака рассчитывается по диаметру и высоте, а чем больше нефти в резервуаре, тем выше крышка и тень на ней. По длине тени можно определить заполненность бака.

Также машинным обучением пользуются страховые компании для борьбы с мошенниками и упрощением работы с клиентами. Так, американская USAA по фотографиям с ДТП автоматически определяет ущерб и сумму страховой выплаты, а у страховой компании Allstate общением с клиентами занимаются чат-боты.

2. Автомобильный рынок

Автомобильная промышленность с 2013 года активно использует компьютерное зрение и глубокое обучение для анализа сцены, автоматического обнаружения полос движения и чтения дорожных знаков, чтобы корректно ограничивать скорость автопилота.

Глубокое обучение также применяется для работы датчиков автоматического обнаружения объектов вокруг автомобиля и контроля ситуации на дороге. Если попытаться сменить полосу не включив поворотник, автомобиль автоматически вернется обратно.

3. Медицина

В области здравоохранения с помощью нейросетей научились быстро выявлять заболевания с помощью МРТ. К примеру, компания Arterys выпустила платформу для визуализации и анализа медицинских изображений, которая используется при диагностике сердечных заболеваний.

Платформа Arterys — облачная самообучающаяся нейросеть на базе машинного обучения. Регулятор FDA (Food and Drug Administration) подтвердил, что результаты Arterys не отличаются по точности от результатов профессиональных врачей, однако человеку требуется от 30 до 60 минут для диагноза, а нейросети — 15 секунд.

Выделение контура желудочков сердца

Платформа универсальна и обезличена: персональные данные больного переносятся на защищенный сервер на этапе подготовки и расшифровываются только после проведения всех анализов. Доступ к результатам есть только у лечащего врача.

4. Розница

Компании анализируют корзины покупателей для выявления популярных товаров и создания рекомендаций для будущих визитов. Ebay в 2017 году начал применять элементы компьютерного зрения, чтобы пользователи могли искать лоты по фотографиям.

Amazon пошел дальше, открыв первый магазин без касс и продавцов Amazon Go, в котором камеры по технологиям машинного обучения распознают товары, взятые покупателем, и автоматически создают счет на выходе человека из магазина. Через несколько минут деньги списываются с аккаунта Amazon покупателя.

5. Финансовые услуги

Банки активно пользуются технологиями машинного обучения для оптимизации расходов и улучшения взаимодействия с клиентами.

Один из основных инструментов — биометрия. Например «Тинькофф Банк» тестирует банкоматы с системой распознавания лиц клиентов и инкассаторов, а на горячей линии банка работает система анализа голоса для ускоренной верификации клиента.

В январе 2017 банк «Открытие» в трех отделениях Москвы запустил проект по идентификации клиентов по лицу, а в этом планирует внедрить денежные переводы по фотографии: мобильное приложение определит получателя по изображению и отправит нужную сумму.

Биометрия и эмоции

Рынок распознавания объектов значительно растет: по прогнозам, с 2,77 млрд долларов в 2015 году он вырастет до 6,19 млрд к 2020. Сейчас происходит переход от распознавания лиц к распознаванию эмоций, что делает варианты использования технологии практически бесконечным.

Самый простой пример — групповое тестирование. Реакция пользователей на видеоигры, рекламные ролики или впечатления от продуктов накапливается автоматически, в большом масштабе и анализируется более эффективно.

Так Bentley использовала распознавание мимики в маркетинговой кампании, чтобы предлагать подходящие модели автомобилей в зависимости от эмоций человека.

Распознавание лиц добавит еще один уровень безопасности в аэропортах, торговых центрах, стадионах и других местах массового скопления людей. Например, пилотное внедрение системы распознавания лиц на нескольких станциях московского метро в период с февраля по март этого года помогло обнаружить девять граждан, находящихся в розыске.

Пример распознавания лица в метро

Системы компьютерного зрения

На рынке присутствует множество движков для работы с лицами и эмоциями людей. И определиться, какой подойдет для каждого проекта и конкретных нужд непросто. Поэтому мы приведем примеры некоторых известных API, а полную картину взаимодействия бизнеса и искусственного интеллекта расскажем на однодневном курсе «Искусственный интеллект в бизнесе».

1. Kairos

Система искусственного интеллекта для распознавания лиц и их анализа. Замер производится с 49 уникальных точек на лице, по которым определяются эмоции и настроение, возраст, этническая принадлежность, пол, наличие очков, направление взгляда, черты лица и многое другое. Можно группировать лица для поиска, а также идентифицировать и верифицировать личность.

Kairos

У проекта есть API и SDK, которые можно использовать под свои нужды. Так, например, iOS разработчик использовал Kairos для распознавания лиц через FaceID в iPhone X. Разработчики предполагают, что систему можно применять в самых разных отраслях: оценивать эмоции людей на тестовых демонстрациях (предпоказы, тест-драйвы), анализировать сонливость водителей-дальнобойщиков и т.п.

2. Amazon Rekognition

Входит в экосистему AWS. Распознает образы на базе машинного обучения.

Умеет анализировать объекты и сцены, определять и распознавать лица и настроение, а также считывать текст с изображений и обнаруживать неприемлемый контент.

Amazon Rekognition

После недавнего обновления сервис научился определять до 100 лиц на фотографии, получая демографические данные и настроение каждого человека.

Amazon Rekognition используется в Here Maps для обновления информации о дорожных знаках.

3. Google Cloud Vision API

Часть облачной платформы Google Cloud. Анализирует изображение и видео, классифицирует объекты на нем по категориям. Умеет распознавать логотипы, географические ориентиры, символы, лица и эмоции, изображения, откровенное содержимое и многое другое.

Google Cloud Vision на базе Raspberry Pi

Интегрирован в основные продукты Google — можно встретить в приложении «Фотографии» на Android-устройствах.

4. Microsoft Cognitive Services

Это часть платформы искусственного интеллекта Microsoft, в которой содержится набор служб, API и SDK от Microsoft. Они добавляют в приложения интеллектуальные функции: распознавание лиц, речи, визуальных образов, эмоций, речи и языка, а также работают с видео.

Демонстрация Cognitive Services на конференции Microsoft Ignite

Cognitive Services совместим с другими сервисами Microsoft — так, объединив Bot Framework и Cognitive Service, можно получить чат-бота для замены операторов горячей линии.

Microsoft активно сотрудничает с бизнесом для интеграции своего API в продукты и сервис: API для распознавания лиц встроен в UBER для авторизации водителей, чат-ботом пользуется Dixons Carphone, британский ритейлер электроники, а в игре Starship Commander используется система интеллектуального распознавания речи.

Технологии машинного обучения не прекращают развиваться, что в будущем означает множество новых возможностей для бизнеса и рекламодателей: к примеру, вскоре появятся целевые объявления, которые используют не только демографические данные, но и наше эмоциональное состояние.

Мы находимся на верхушке айсберга, когда говорим о взаимодействии компьютера и человека, но когнитивные технологии — большой шаг вперед для создания настоящего эмоционального машинного интеллекта.

0
Комментарии

Комментарий удален модератором

Развернуть ветку
-3 комментариев
Раскрывать всегда