{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

AI распознавание

Сейчас искусственный интеллект помогает нам во всем, сохраняя наше время для действительно важного — развития, генерации новых идей, дискуссий на тему “Угрожает ли ИИ человечеству” или просмотра сериалов.

Но началось все в прошлом веке, когда предок ИИ помогал нам… беречь подушечки пальцев, предугадывая слова.

В конце 90-х американская компания Tegic Communications разработала, на тот момент прорывную, систему набора слов для мобильных телефонов, позволяющую набирать текст на клавиатуре, состоящей только из цифр.

Систему нарекли T9 по принципу Text on 9 keys — набор текста на 9 кнопках.

По словам разработчиков, функции «рассмешить” и »скомпрометировать” в бэклог не входила, но все мы помним.

Шутки в сторону: T9 — действительно один из первых, так называемых Language Models. Став прорывом для своего времени и, система дала старт многим другим способам анализа, распознавания и предсказания текста и не только.

Tegic Communications — ОК, но что же в это время делали такие технологический гиганты как Apple и Google?

В 2001 году Google презентовал миру новый сервис по распознаванию изображений — Google Images.

В России более известный как Google Картинки — специальный сервис для поиска картинок в Интернете. Внутри него-поисковый робот, сканирующий страницы для индекса картинок различных форматов — JPEG, GIF, PNG, BMP, SVG, WebP, ICO. На момент выхода на рынок поисковый робот был способен индексировать 250 миллионов картинок, а в 2011 году в строке ввода появился значок “фотоаппарат”, активировав который, изображение можно загрузить со своего смартфона и найти нужные сникерсы по одной лишь фотке.

В том же году подопечные Стива Джобса предлагают продвинутому человечеству новый способ поиска данных — Siri.

Siri была придумана чтобы помочь пользователям, через распознавание голоса, в выполнении различных задач от поиска информации до управления календарем.

В 2016 Google выводит на диджитальную орбиту своего “ассистента”.

Google Assistant — интеллектуальный голосовой помощник, способный через команду Okey Google! подбирать и извлекать информацию, выводя её в более привлекательном виде для пользователя.

Базис Siri и Google Assistant это технология распознавания голоса, основанная на алгоритмах машинного обучения, умноженная на нейронные сети для обработки звуковой информации и преобразования ее в текст.

К тому что нейросети способны преобразовать звук в текст мы уже привыкли, а как насчет того, чтобы конфигурировать из нечитаемого в понятный?

Легко!

Студентам-историкам из проекта Vesuvius Challenge удалось прочесть свитки древних Геркуланумских папирусов, которые были погребены и обуглены в результате извержения Везувия в 79 году нашей эры.

Современности алгоритмы распознавания нужны не меньше, чем прошлому, например, для обеспечения безопасности в общественных местах.

(Просим пропустить этот абзац лиц, страдающих параноидальными особенностями развития личности): )

Face ID-cистема распознавания лиц и одна из биометрических систем аутентификации. Программа считывает геометрию, затем преобразует изображения в данные: в процессе анализа лицо преобразуется в набор данных на основе индивидуальных черт. Цифровой код называется «отпечатком лица».

У каждого человека есть свой уникальный отпечаток лица, так же, как и отпечатки пальцев. Затем отпечаток лица сравнивается с данными в базе известных лиц, которая перманентно пополняется.

Например, у ФБР есть доступ к 700 млн фотографий, взятых из баз данных различных стран. В Facebook все фотографии, на которых отмечены люди, становятся частью базы данных Facebook, которая также может использоваться для распознавания лиц.

Помимо обеспечения безопасности, Face ID полезна для распознавания лиц при разблокировке устройств. Если верить Apple то, шанс разблокировки телефона случайным лицом составляет примерно один из миллиона.

Еще больше причин сохранять лицо в любой ситуации: )

Кстати, для медицины алгоритмы распознавания тоже успели принести много полезного.

Рабочие процессы мед. учреждений неразрывно связаны со сбором, обработкой и анализом различных медицинских изображений: рентген, КТ, цифровые гистологические исследования — согласитесь, есть где развернуться.

Под направление искусственного интеллекта, которое занимается работой с изображениями и видеопотоком, получило название Computer Vision или компьютерное зрение. Это направление является наиболее перспективным в медицинской диагностике и скрининге патологий.

Сервисы с применением технологии компьютерного зрения разрабатываются по всему миру и помогают врачам выявлять признаки различных заболеваний, в том числе онкологии.

Один из таких проектов — Цельс, разработка российской команды «Медицинские скрининг системы». В компании разработали AI-платформу для анализа медицинских изображений.

«Цельс» — первое в России решение на основе искусственного интеллекта в здравоохранении, получившим регистрационное удостоверение медицинского изделия по наивысшему (III) классу риска. Компания обладатель патента на изобретение, 4-х зарегистрированных товарных знаков, CE Mark и нашего приза зрительских симпатий: )

Хотя, в отношении некоторых диагнозов скайнет все еще бессилен…

Технологии распознавания помогают не только в глобальных целях человечеству, но и в экономии бизнесу.

Мы в Garpix придумали Garpix 3D Scan — программно-аппаратный комплекс способный определять весогабаритные характеристики предметов за… 1 секунду.

Звучит невероятно, но это факт!

Используя 3D Scan можно без просчета определить весо-габаритные характеристики товаров, тем самым, исключить товарную пересортицу в магазине, сократить процент брака, автоматически получить данные в любой системе складского учета да и в целом, оптимизировать расходы и все процессы складской логистики.

Вы не успели подумать, а Garpix 3D Scan уже уменьшил все зависимые ошибки на этапах размещения и отгрузки товара со склада.

Умный скан легко интегрируется с WMS, ERP, 1C и другими системами учета и полностью исключает потерю данных и человеческий фактор.

И по старой аналитической традиции- лучше один раз увидеть, чем сто раз услышать, поэтому…

0
Комментарии
-3 комментариев
Раскрывать всегда