{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

ИИ в обычных сферах рынка. С чего начать?

Автор статьи - Виталий Колпаков
Специалист по проектам "Департамента интеграции" компании "ОЛЛИ ИТ", г. Санкт - Петербург

Данная статья посвящена внедрению ИИ в самые обычные сферы деятельности человека. Я постараюсь избежать новостей внедрения ИИ глобальными игроками только у себя в инфраструктуре. Также я раскрою некоторые технические требования, для внедрения ИИ у себя.

Простым языком - я буду пытаться применить ИИ к тому, что есть в каждом городе: магазины, цеха, медицинские центры и т.д. Попутно с этим, я приведу примеры того, что уже есть непосредственно в РФ, чтобы показать, что практически любая компания может внедрить технологии ИИ уже завтра, а может даже и сегодня, получив от этого выгоду, качественно обходя своих конкурентов. Все таки эта статья посвящена именно владельцам малого и среднего бизнеса, поэтому я буду описывать ситуацию с точки зрения применения «любым желающим».

Если Вам не интересно читать предысторию и некоторые технические выкладки - листайте статью к теме «КЕЙСЫ», ради которой она и задумывалась.

ВВЕДЕНИЕ

Если посмотреть выдачи поисковых систем по теме ИИ, то за редким исключением мы получим примерно следующую картинку.

Как видно из скриншотов, выдачи поисковика (Google/VC) и дополнительно материалов конференции AI Jorney - все это связанно со стартапами и глобальными корпорациями, плюс окутано аурой недоступности обычному «пользователю».

И у этого конечно же есть логическое обоснования:

  • Серьезные разработки требуют специалистов высокой квалификации в сфере ML, что влечет за собой высокие затраты;

  • Большие компании обладают большим количеством данных для обучения нейросетей;
  • Внушительное количество стартапов создают свои продукты для продажи корпорациям и их разработки в редких случаях будут публичными.

Это, пожалуй, основные причины из-за которых технологии ML не внедряются в рядовые компании. Хотя уже есть достаточное количество готовых кейсов и программное обеспечение, которое решает устоявшиеся задачи, связанных с компьютерным зрением или ML. К примеру: Trassir или Macroscope (мы занимаемся их поставкой). Так же существуют и объективные причины со стороны малого и среднего бизнеса, почему нейросети пока еще идут к ним.

  • Отсутствие достаточного количества данных для обучения сетей;
  • Отсутствие необходимого технического оснащения и средств для обучения сетей;
  • · Отсутствие свободного времени или нежелание изучения новых подходов в бизнесе.

Игнорирование этих проблем не убережет от прихода глобальных игроков (ПРИМЕР1) (что и в обычном варианте является плохим знаком) или появления подрывных стартапов в сфере (ПРИМЕР2). Поэтому я попытаюсь описать минимальный machine learning starter pack для первых шагов к внедрению ИИ у себя в бизнесе.

График показывает потерю рабочих мест из-за компьютеризации. Но стоит понимать, что за рабочими местами стоят традиционные компании, часть из которых уйдет с рынка.

Поэтому смысл этой статьи показать, что хоть внедрение ИИ этой сложный и долгий процесс, но окупается с троицей.

ТЕХНИЧЕСКИЕ АСПЕКТЫ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ

Нейронные сети показывают исключительную эффективность в работе с совершенно разными данными – изображениями, звуками, видео, символами, но для того, чтобы получить приемлемую нейросеть, которая выдает достоверный результат, должна пройти множество итераций ее обучения. Эффективность обучения нейросети зависит от мощности оборудования, на котором она обучается. От мощности оборудования зависит скорость самого обучения, следовательно и кол-во затраченных средств. Итак:

CPU: Непосредственно в обучении CPU не используется, однако для поддержки работы большого количества GPU/мощного GPU нужен мощный процессор.

GPU: На работе GPU завязано все обучение нейронной сети. Мощная видеокарта способна обработать больше пакетов данных из Датасета.

DDR: Большое кол-во оперативной памяти способно отправлять Датасеты в GPU без сжатия.

M.2: На диске будут храниться все Датасеты. Диск с низкой пропускной способностью станет узким горлышком для все системы

В ссылке находятся примеры потребляемой нейросетью мощностей рабочей станции: https://github.com/albanie/convnet-burden#object-detection-architectures

Подобные показатели не по зубам CPU. Самая средняя видеокарта может обойти мощный серверный процессор с запасом.

Нормализованные исходные данные производительности графических процессоров и TPU. Чем выше, тем лучше. RTX 2080 Ti примерно в два раза быстрее GTX 1080 Ti: 0,77 против 0,4.

Существуют общие рекомендации при выборе карты для ML, а именно:

Лучший GPU в целом: Quatro RTX A6000.

Рентабельно, но дорого: RTX 2070.

Средний вариант: GTX Titan (Pascal), GTX 1060 (6GB), GTX 1050 Ti (4GB).

Бюджетный вариант: GTX Titan (Pascal), или GTX 1060 (6 ГБ), или GTX 1050 Ti (4 ГБ).

Самый бюджетный вариант: GTX 1050 Ti (4 ГБ); CPU (прототипирование) + AWS / TPU (обучение);

Для работы с компьютерным зрением и машинным переводом: Quatro RTX A6000.

КЕЙСЫ

Пример #1 Магазин

Обычный магазин приходит в голову любому, кто дочитал статью до этого предложения. Благо уже есть достаточно пресетов для обучения машины конкретно для этого типа бизнесов.

Если мы говорим о магазине (том в который ходят люди), то в голове возникают сразу несколько коммерчески полезных задач, а именно:

  • Кто приходит в магазин? (определение личности/ возраста/ пола)

  • Какие зоны магазина наиболее популярны?
  • Время пикового посещения

ВНЕДРЕНИЕ

Думаю не нужно объяснять, что задачи исключительно маркетинговые. Проецируя задачи на ИИ, нам нужно обучить приходящий видеопоток (камеры, которые стоят в магазине) распознавать людей, их лица, треки ходьбы по магазину и т.д.

Чтобы технически подготовиться к этой задачи хватит и обычного ПК, в котором есть малая мощная видеокарта (она и будет учить нейросеть).

Для сети магазинов (3 здания) хватит следующей конфигурации ПК (можете проконсультироваться с нашими специалистами, они выберут идеально подходящую конфигурацию)

CPU: Ryzen 9 3900X

GPU: RTX 2070

DDR: Vengeance RGB Pro 32gb ram

M.2: 970 EVO NVMe M.2 500gb-1TB

Еще нужны камеры с поддержкой IP, но в остальном этого достаточно, чтобы начать внедрять либо готовое ПО (о нем мы будем говорить в будущих статьях), либо написать свою нейронную сеть… Естественно у любого директора магазина НЕТ навыков написания подобных вещей, поэтому обратимся к бирже фриланса для реализации задачи.

На рынке услуг начинают появляться специалисты, которые берутся за такие задачи.

Либо, если вы не ищете легких путей есть статья: https://vc.ru/selectel/41002-instrukciya-sozdanie-neyronnoy-seti-bez-navykov-programmirovaniya . Вникайте в суть вещей самостоятельно.

Хотя, подобные вопросы уже поднимались на Хабре: https://qna.habr.com/q/233065

В сети уже есть достаточное кол-во Датасетов для обучения https://habr.com/ru/company/mailru/blog/339496/

И само обучение может занять до 2 недель, в зависимости от задачи, мощности ПК и корректности Датасета. Эксперт ML может дать более точный ответ на этот вопрос.

Т.к. нейронная сеть выполняет исключительно маркетинговые операции - это напрямую связано с выручкой. Точность целевой аудитории и «теплота» прилавков коррелирует с прибылью компании. https://habr.com/ru/post/455878/

Практика

Пример #2 Медицинский центр

В рамках медицинских услуг есть большое количество кейсов делающих более точную постановку диагноза, следовательно и более точное лечение. Неправильный диагноз усложняет лечение и, как бы это цинично ни звучало, ухудшает репутацию медицинского учреждения.

На данный момент есть достаточно много Best-practice применения ML в клиниках.

Пруф1 https://www.cell.com/cell/fulltext/S0092-8674(18)30154-5 (аналитика рентгеновских снимков)

Пруф 2 https://madeinrussia.ru/ru/news/2570

Пруф 3 https://cs.stanford.edu/people/esteva/nature/ (аналитика рака кожи)

ПРОБЛЕМЫ СФЕРЫ

Основной проблемой данного направления является цена ошибки. Это может быть упущенное время/ осложнения или даже человеческая жизнь. Поэтому нужно правильно позиционировать ИИ такого рода. Они всего лишь помогают врачам сделать более правильное решения, а не снимают с него ответственность.

ВНЕДРЕНИЕ

Медицинские данные не привязаны к геолокации. Т.е. картина течения болезней будет одинаковой в Мадриде, Лос-Анджелесе или Омске. Это означает, что можно пользоваться открытыми Датасетами, было бы желание. Далее - нужна машина, на которой будет проводиться обучение нейросети. Надо понимать, что цена ошибки выше, чем в предыдущем примере, значит, нам нужно больше мощностей для прогонки огромного количества Датасетов.

Хорошей конфигурацией будет DELL сервер с картами Quatro:

Хорошей конфигурацией будет:

CPU: Ryzen 9 3900X

GPU: Quatro RTX A6000

DDR: Vengeance RGB Pro 32gb ram

M.2: 970 EVO NVMe M.2 500gb-1TB

Идеальной:

CPU: Ryzen 9 3900X

GPU: 2xQuatro RTX A6000

DDR: Vengeance RGB Pro 64gb ram

M.2: 970 EVO NVMe M.2 1TB

Еще более ответственно нужно подойти к поиску специалистов в данной области, но это уже на совести HR.

СКОЛЬКО ВРЕМЕНИ ЗАЙМЕТ ОБУЧЕНИЕ?

В зависимости от конфигурации сервера/кол-ва Датасетов/болезни, ну и конечно же от мастерства специалиста ML.

ПРАКТИКА

Пример #3 Цех-Фабрика

Брак продукции является родовой проблемой любого производственного предприятия. Сегодня уже есть кейсы распознавания дефектной продукции на конвейере. Нельзя сказать, что реализация данного кейса является простой задачей, потому как каждое предприятие уникально как по техпроцессу, так и по продукции, которую оно изготавливает. Следовательно, и нет Датасетов, которые помогут обучить модель. В данном случает придется обучать ее с нуля, на основе тех видеоданных, что уже есть в базе, а также ежедневно производятся.

Для завода с десятком камер на производственной линии хватит следующей конфигурации сервера для обучения.

Dell PowerEdge R840

CPU: 2x Intel Xeon Gold 6248

GPU: 4 x NVIDIA Quadro RTX 6000 (5000) 24 GB

DDR: DDR4 512gb

M.2: 970 EVO NVMe M.2 20TB

Обучение подобных сетей может занять месяцы из-за недостатка данных.

На российском рынке уже появляются первые представители.

Практика

Пример #4 Агрокомпания

Финальный пример посвящен агрокомпаниям. Так уж сложилось исторически, что РФ всегда занимает высокие мировые позиции по части агропроизводства (но традиционного). Однако уже сейчас появляются компании пионеры, которые внедрили средства аналитики урожая и отслеживания и сортировку продукции.

Проблемы сферы

Проблема качества финальной продукции стоит еще острее, чем в серийном производстве, но кроме этого добавляется проблема хранения и перевозки. Товар в большинстве случаев является скоропортящимся, а значит время здесь играет ключевую роль.

Основные задачи агропрома:

  • Своевременный сбор урожая;
  • Поиск "недозрева";
  • Порча продукции на стеллажах хранения.

Хорошей сборкой сервера здесь будет решение на основе Dell PowerEdge серии R940

Dell PowerEdge R940

CPU: 2x Intel Xeon Gold 6248

GPU: 8 x NVIDIA Quadro RTX 6000 24 GB

DDR: DDR4 512gb

M.2: 970 EVO NVMe M.2 20TB

Поиск порчи продукции https://actascientific.com/ASAG/pdf/ASAG-03-0437.pdf

Иностранная практика

https://www.iflexion.com/blog/machine-learning-agriculture

0
2 комментария
Elena Yelenovna

Какой бюджет примерно на это выходит?

Ответить
Развернуть ветку
Наталья Аникина
Автор

Елена, доброе утро!

Если речь о стоимости оборудования, то в таком случае специалисты "ОЛЛИ" проведут сайзинг и посчитают оборудование под ваши задачи.
Вы можете оставить заявку на [email protected], или же позвонить по номеру +7 (812) 703 30 62. 

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
-1 комментариев
Раскрывать всегда