«Машины недостаточно умны, чтобы обучать себя сами»: как дешёвая рабочая сила в Китае обучает искусственный интеллект

Конспект материала The New York Times.

Серьёзная работа над технологиями в Китае ведётся не только в Пекине и Шэньчжэне, но и на бывшем цементном заводе в глубине страны, считает автор The New York Times. В этом здании находится компания, помогающая искусственному интеллекту познавать мир. Около двадцати молодых сотрудников просматривают различные фотографии и видео, маркируя практически всё, что видят: машины, светофоры и так далее.

Труд рабочих на таких заводах оплачивается мало, считает NYT. В небольших городах появляются стартапы, которые учат искусственный интеллект различать предметы, работая с множеством фотографий и видео с камер наблюдения. Если сравнить Китай с Саудовской Аравией и представить, что основной ресурс Китая — данные, то эти стартапы перерабатывают сырьё и получают топливо, которое в дальнейшем можно использовать для развития искусственного интеллекта.

Yunzhi Data Processing Company располагается на бывшем цементном заводе Янь Цун для The New York Times

США и Китай сейчас соревнуются в этой области технологий. Но по мнению The New York Times, у Китая есть несколько преимуществ.

Государство финансово и политически поддерживает компании, занимавшиеся разработкой искусственного интеллекта.
В 2017 году китайские стартапы занимали одну треть рынка искусственного интеллекта, опередив Соединённые Штаты.
Китайских учёных чаще цитируют в научном сообществе. Более того, в 2017 году правительство объявило, что планирует стать мировым лидером в области искусственного интеллекта в 2030 году.

Главное преимущество Китая в том, что у государства и компаний благодаря слабой политике защиты данных есть доступ к огромному количеству информации, пишет NYT. Но информация бесполезна, если её не проанализировать и не обработать.

Возможность обрабатывать данные — вероятно, и есть истинная сила Китая. «Мы строители в цифровом мире. Наша работа — класть один кирпич за другим», — объясняет Ий Якэ, сооснователь завода по маркированию данных в одном из городов центральной провинции Хэнань.

Искусственный интеллект хорошо справляется со сложными вычислениями, но ему не хватает способностей, которыми обладает обычный пятилетний ребёнок. Поэтому искусственный интеллект нужно обучать. Прежде чем он начнёт понимать, что чёрная и белая кошка — это одно и то же животное, ему нужно обработать огромное количество маркированных фотографий и видео. Тут и приходят на помощь фабрики данных.

Маркировщики помогли компании AInnovation наладить работу автоматического кассового аппарата, созданного для китайской сети булочных магазинов. Покупатели могли выбрать товар, поднести его к сканнеру и заплатить без помощи человека.

Но почти в 30% случаев система не могла отличить кекс от пончика из-за освещения или движений покупателя, которые влияли на исходное изображение. Работая с фотографиями из магазина, маркировщики смогли улучшить точность распознавания товаров до 99%.

Фабрики данных появляются далеко от больших городов, где низкие цены на труд и аренду. Многие сотрудники таких фабрик в прошлом работали на сборочных конвейерах или стройках. По информации NYT, такой работы становится всё меньше, зарплаты растут медленнее, и многие китайцы предпочитают работать недалеко от дома.

Офис компании Yunzhi Янь Цун для The New York Times

Издание рассказывает о местном жителе Ий Якэ. Он был безработным, когда кто-то из его знакомых упомянул о маркировании данных для искусственного интеллекта. Он почитал про эту область в интернете и заметил, что там нужен низкооплачиваемый труд, которого в Хэнане предостаточно. В марте 2018 года Якэ с друзьями основал компанию Ruijin Technology.

Якэ не беспокоится о том, что останется безработным из-за искусственного интеллекта. «Машины недостаточно умны, чтобы обучать себя сами», — считает он. Проблема заключается в том, где найти людей. Некоторые потенциальные сотрудники считают, что знают слишком мало об искусственном интеллекте. Другие думают, что эта работа скучная.

В большинстве случаев клиенты не говорят, для чего они обращаются в фабрику данных. Но иногда это понятно сразу. Например, маркирование светофоров, дорожных знаков, пешеходов обычно нужно для беспилотных автомобилей.

Хоу Сямэн, о которой шла речь в начале статьи, основала компанию на бывшем цементном заводе, принадлежащем одному из родственников мужа. После окончания университета Хоу маркировала лица в компании Megvii. Жизнь в Пекине была слишком дорогой, и она решила вернуться домой, чтобы основать собственную фабрику данных.

Хоу Сямэн, подобно Ий Якэ, не думает о последствиях своей работы. «Рядом с камерами я чувствую себя в безопасности, — говорит Хоу Сямэн. — Пока что машины подчиняются нам».