Коммерциализация ИИ в Китае: Megvii создает ИИ, создающее ИИ

Китайское издание о технологиях Kr-ASIA рассказывает о попытках китайских компаний разработать вполне конкурентоспособные технологии ИИ для внутреннего рынка.

Один из четырех так называемых ИИ «драконов» в Китае - компания Megvii разработала опен сорс платформу, которая позволяет клиентам создавать технологии ИИ для решения своих задач. Платформа использует ИИ, чтобы разрабатывать ИИ под нужды клиентов. Хотя решение использует самые передовые технологии и особенно востребовано в логистике, тем не менее Kr-ASIA отмечает, что большинство китайских стартапов используют американские опен сорс решения.

Китайский дракон с ИИ помогает создать экосистему с сильным ИИ в Китае, используя опен сорс платформу Brain++.

Последний отчет, посвященный рынку ИИ от McKinsey: в следующем десятилетии Китай будет самым перспективным рынком для развития технологий ИИ. В Китае пока есть целые индустрии, которые традиционно отстают от глобальных игроков, а значит являются привлекательными отраслями для применения технологий ИИ: автомобилестроение, транспорт, логистика, промышленность, ПО, здравоохранение.

Китай считает ИИ новым драйвером своего экономического развития. Четыре крупные китайские компании - «драконы» - являются двигателями технологий ИИ: Cloudwalk, Yitu, SenseTime и Megvii.

Megvii - главный китайский "дракон" ИИ

Первой из четверки стала заниматься ИИ Megvii. Компания была основана в 2011 году в Пекине тремя выпускниками университета Tsinghua: Yin Qi, Tang Wenbin и Yang Mu. Они писали работы под руководством известного теоретика вычислительной науки - Andrew Chi-Chih Yao. Andrew получил премию Тьюринга* за фундаментальные работы в области теории вычислений в 2000 году, это Нобелевская премия в ИТ. Сейчас у компании 4 исследовательских центров в стране.

* Премия Тьюринга - самая престижная премия в информатике, вручаемая Ассоциацией вычислительной техники за выдающийся научно-технический вклад в этой области. Премия учреждена Ассоциацией в честь выдающегося английского учёного Алана Тьюринга, получившего первые значительные результаты в вычислительной математике задолго до появления первых электронных вычислительных машин.

Премия ежегодно вручается одному или нескольким специалистам в области информатики и вычислительной техники, чей вклад в этой области оказал глубокое и продолжительное влияние на компьютерное сообщество. Премия может быть присуждена одному человеку не более одного раза. В сфере информационных технологий премия Тьюринга имеет статус, аналогичный Нобелевской премии в академических науках. Впервые Премия Тьюринга была присуждена в 1966 году Алану Перлису за развитие технологии создания компиляторов.

Спонсорами премии являются американские корпорации Intel и Google. Размер премии составляет 250 000 долл. США.

Megvii известна своей технологией распознавания лиц. Компания разработала интеллектуальную экосистему, которая оптимизирует эффективность работы IoT устройств в секторе промышленности, логистики и городского управления. В Megvii работает 2 000 человек. Один из инвесторов компании – гигант электронной коммерции Alibaba.

В Megvii три бизнес вертикали: персональные IoT устройства, городские IoT устройства, промышленные IoT устройства для предприятий.

В 2020 году Megvii запустила платформу Brain++, которая помогает бизнесу разрабатывать ИИ технологии для решения своих задач.

Платформа использует фреймворк* глубокого обучения и разрабатывает решения для предприятий, чтобы ускорить их цифровизацию. Алгоритм платформы покрывает весь жизненный цикл разработки технологии ИИ, начиная от управления данными до оптимизации моделей и планирования (scheduling).

*фреймворк - это программная платформа, которая упрощает разработку программного продукта, определяет структуру проекта и помогает удобно объединять в нём разные компоненты.

*планирование (scheduling) - действия по распределению ресурсов для выполнения задач. Например, ресурсами могут быть процессоры, сетевые каналы или платы расширения. Задачами могут быть потоки, процессы или потоки данных.

Megvii: Brain++ может сократить время разработки алгоритма на 80% и сократить расходы на разработку алгоритма до 55%

Разработка ИИ алгоритмов может быть довольно сложной задачей, требующей значительных усилий для разработки и исследований. Создание «домашнего» фреймворка «с нуля» требует значительных ресурсов, как временных, так и организационных, обеспечивающих гладкость выполнения алгоритмов.

Sun Jian, главный научный работник Megvii: Brain++ помогает предприятиям преодолеть сложности цифровизации. Платформы глубокого обучения обеспечивают не только быстрое развитие алгоритмов, но и создают алгоритмы, четко подстраиваемые под потребности конкретной компании.

Brain++ появилась на рынке в 2020 году, но ее разработка началась гораздо раньше.

Tang Wenbin со-разработчик и CTO в Megvii: «Разработка платформы началась в 2014 году. Нашей целью было дать доступ команде R&D к самому широкому спектру технологий и компетенций: от управления данными до индустриальных алгоритмов, чтобы они не изобретали велосипед и могли найти легкий способ ускорить развитие ИИ».

Почему важен модуль машинного обучения в Brain++

Благодаря встроенному модулю машинного обучения* Brain++ может «разрабатывать алгоритмы, обучающие другие алгоритмы, то есть создает ИИ, используя ИИ».

*Машинное обучение - это класс методов искусственного интеллекта, характерной чертой которых является не прямое решение задачи, а обучение за счёт применения решений множества сходных задач. Для построения таких методов используются средства математической статистики, численных методов, математического анализа, методов оптимизации, теории вероятностей, теории графов, различные техники работы с данными в цифровой форме.

Технология глубокого обучения* требует большого количества неструктурированных данных, которые должны быть проанализированы и размечены человеком. Это называется аннотация данных, когда мы маркируем данные, чтобы сделать объекты распознаваемыми алгоритмами. Данные могут быть любыми: текст, изображения, видео. Все они распознаются алгоритмом. Этот процесс может быть довольно затратным по времени и дорогим, так как в основном компаниями используется технология контролируемого обучения (с учителем)* . Ошибки в данных могут превращаться в предубеждения алгоритма, и в результате алгоритм будет делать некорректные прогнозы (предсказания).

*Глубокое обучение является передовой областью исследований машинного обучения. Это в общем-то совокупность методов машинного обучения (с учителем, с частичным привлечением учителя, без учителя, с подкреплением), основанных на обучении, а не специализированных алгоритмах под конкретные задачи. Оно представляет из себя нескольких скрытых слоев искусственных нейронных сетей. Методология глубокого обучения применяет нелинейные преобразования и модельные абстракции высокого уровня на больших базах данных. Последние достижения во внедрении архитектуры глубокого обучения в многочисленных областях уже внесли значительный вклад в развитие искусственного интеллекта.

*Контролируемое обучение (с учителем) - это задача машинного обучения по обучению функции, которая сопоставляет входные данные с выходными на основе примеров пар вход-выход. Он выводит функцию из помеченных обучающих данных , состоящих из набора обучающих примеров. При обучении с учителем каждый пример представляет собой пару, состоящую из входного объекта (обычно вектора) и желаемого выходного значения (также называемого контрольным сигналом). Алгоритм обучения анализирует данные обучения и выдает предполагаемую функцию, которую можно использовать для отображения новых примеров.

Платформа значительно улучшает скорость аннотации данных для глубокого обучения, снижает накладные расходы, связанные с процессом сбора и маркировки данных. Аннотация данных является главной расходной статьей в бюджете на разработку технологии ИИ и часто является главным фактором, мешающим удешевить коммерциализацию ИИ технологий.

Развитие технологий ИИ может формировать новый рост возможностей использования ИИ. Разработчики ИИ смогут предложить клиентам больше ценности.

Изначально Megvii использовала платформу для своих целей и не предлагала ее клиентам. Но вскоре компания поняла, что стоит сфокусироваться на коммерциализации технологии глубокого обучения.

Hetu -роботизированная операционная система для логистики

Megvii решила выйти в сектор логистики, где использование ПО с ИИ и роботы могут оптимизировать огромную экосистему доставки Китая.

Megvii мечтает стать «главной ИИ компанией» для логистики. В 2020 году Megvii запустила платформу Hetu 2.0, это версия роботизированной операционной системы Hetu. Hetu используется в более чем 100 складах различных китайских компаний с января 2019 года.

Hetu создана на основе фреймворка глубокого обучения MegEngine. Это один из трех компонентов платформы Brain++. Таким образом компания пытается бросить вызов таким фреймворкам техно гигантов как TensorFlow от Google и Pytorch от Facebook.

MegEngine использовалась для тренировки компьютерного зрения, что является ключевым для роботизированных систем в логистике. Остальные два компонента платформы - MegData (система управления данными) и MegCompute (система распределения вычислительных мощностей).

Зависимость от американских технологий глубокого обучения

Многие китайские стартапы опираются на американские опен сорс решения. Зависимость от американских фреймворков глубокого обучения китайской компанией рассматривается как значительный пробел в китайской экосистеме технологий ИИ.

Стратегия Megvii по коммерциализации своих технологий ИИ соответствует национальному плану Китая по развитию локальных кадров, включая стремление снизить зависимость китайских компаний от американских фреймворков.

Пока использование китайских опен сорс решений ИИ не превалирует над американским опенсорс. GitHub: если сравнить опен сорс решение PaddlePaddle от китайской платформы Baidu с американским TensorFlow (Google), то Baidu используется в восемь раз меньше, и в принципе ее популярность среди разработчиков падает.

Начать дискуссию