Неизвестная история распознавания лиц

Шестьдесят лет назад сын издольщика изобрел технологию идентификации лиц, но затем почти все сведения о его вкладе в эту область исчезли. Кем же был Вуди Бледсо и на кого он работал?

Вуди обучил компьютер выделять отдельные черты лица, а затем сопоставлять расстояние между ними. Компьютер не смог распознать, что на двух его портретах — 1945 и 1965 годов — изображен один и тот же человек.

Вуди Бледсо сидел в инвалидном кресле в своем открытом гараже и ждал. Любой, кто видел его всего лишь за несколько месяцев до этого или раньше — здоровался по субботам в местной мормонской церкви или встречал во время его пробежек по городу, — скорее всего, не узнал бы этого 74-летнего мужчину. Его лицо утратило привычную округлость, щеки ввалились. Дегенеративное заболевание — боковой амиотрофический склероз (БАС) — лишило его возможности ходить и говорить. Он мог лишь с трудом выводить короткие фразы на маленькой доске для письма стираемым маркером. Но ум Вуди оставался по-прежнему ясным. Тем утром в начале 1995-го его сын Ланс приехал в дом к отцу в Остин, штат Техас. Вуди немедленно взял маркер и начал выводить инструкции.

Он велел сыну притащить с заднего двора мусорку — старый металлический бак вроде того, в котором живет Оскар Ворчун. Ланс принес бак и поставил его рядом с отцом. Затем Вуди отправил сына в дом за спичками и жидкостью для розжига. Когда Ланс вернулся, Вуди указал ему на два больших шкафа для бумаг, стоящих в глубине гаража.

Они были там всегда, сколько Ланс себя помнил. Сейчас ему было уже под сорок, и он был практически уверен, что их не открывали ни разу со времени его детства. Ланс знал, что это не обычные шкафы для бумаг. Такие он видел, работая над гидроакустическим оборудованием для американских атомных подводных лодок, — огнестойкие, очень тяжелые, с надежным кодовым замком на каждом ящике. Отец начал медленно выводить цифры на своей доске, и, к удивлению Ланса, код оказался верным. «Открыв первый ящик, я почувствовал себя Индианой Джонсом», — рассказывает он почти 25 лет спустя.

Внутри лежала толстая стопка старых истлевших документов. Ланс начал вынимать их и вкладывать в руки отцу. Вуди быстро просмотрел бумаги, а затем велел сыну бросить их в огонь, разведенный в мусорном баке. Ланс заметил, что на некоторых документах стояли отметки «Секретно» или «Не копировать». Пламя все разгоралось, и наконец оба шкафа были пусты. Вуди отказывался покидать гараж, пока все их содержимое не превратилось в пепел.

Лансу оставалось только гадать, что именно он помог уничтожить. Почти тридцать лет его отец, профессор Техасского университета в Остине, работал в области автоматизации рассуждений и искусственного интеллекта. Ланс знал его как наивного ученого-оптимиста, из разряда тех, кто еще в конце 1950-х грезил о создании компьютера, ни в чем не уступающего человеку, — машины, способной доказывать сложные математические теоремы, поддерживать беседу и достойно играть в пинг-понг.

Однако на заре своей карьеры Вуди был поглощен попытками наделить машины одной-единственной, недооцененной, но опасно могущественной способностью человеческого мозга — распознавать лица. Ланс знал, что первые исследования отца в этой сфере привлекли внимание американских спецслужб. Фактически основными спонсорами Вуди были подставные компании ЦРУ. Возможно, Ланс сжег свидетельства первых попыток массовой автоматизированной идентификации людей, предпринятых правительством США?

Сегодня технология распознавания лиц является наиболее эффективным средством защиты для телефонов, ноутбуков, паспортов и платежных приложений. В перспективе она способна произвести революцию в сфере таргетированной рекламы и ускорить диагностику определенных заболеваний. Она позволяет нам с легкостью отмечать друзей на фото в Instagram.

Исследования в области распознавания лиц, проведенные Вуди в 1960-х, предвосхитили эти технологические прорывы и связанные с ними щекотливые этические вопросы. Однако об этих его ранних основополагающих трудах практически ничего не известно. Многие из них так и не были опубликованы.

К счастью, несмотря на решение, принятое Вуди в тот день в 1995-м, большая часть его исследований и писем избежала гаражного костра. Тысячи страниц документов — 39 коробок — хранятся в Центре американской истории Дольфа Бриско в Техасском университете. Среди прочего в этих коробках лежит множество фотографий лиц. Некоторые из них покрыты странными математическими символами, словно люди на снимках страдали от какой-то геометрической кожной болезни. Эти портреты — свидетельства зарождения технологии, которая в последующие десятилетия будет становиться все более сложной, эффективной и распространенной.

Вудро Вильсон Бледсо — Вуди для всех, кто его знал — не смог бы припомнить ни одного дня, когда бы он не работал. Он родился в 1921 году в городе Мэйсвиль в Оклахоме и с ранних лет помогал отцу-издольщику поддерживать семью на плаву. Всего в семье Бледсо было 12 детей. Вуди, десятый из них, проводил дни за прополкой кукурузы, сбором валежника и хлопка, кормлением цыплят. Его мать, бывшая школьная учительница, рано разглядела острый ум мальчика. В неопубликованном эссе, написанном в 1976 году, Вуди описывает ее "воодушевляющее влияние" — даже несмотря на то, что источником воодушевления иногда становилась розга из ветки персикового дерева.

Когда Вуди было 12, его отец умер, оставив семью в бедственном положении в разгар Великой депрессии. Вуди устроился работать на куриную ферму, а затем, окончив среднюю школу, переехал в город Норман и начал посещать занятия в Университете Оклахомы. Но уже через три месяца бросил учебу и ушел в армию — прямо накануне Второй мировой войны.

Продемонстрировав хорошие способности к математике, он получил должность руководителя зарплатного отдела военной базы Форт-Леонард-Вуд в Миссури, где все новые и новые солдаты армии США проходили подготовку перед отправкой на фронт. "К нам поступали все черные новобранцы, — писал наш оклахомец. — Для меня это было необычно". 7 июня 1944 года, на следующий день после высадки десанта союзников в Нормандии, Вуди наконец перебросили в Европу. Там он получил Бронзовую звезду, разработав способ доставки на Рейн больших военных судов, предназначенных для высадки на необорудованный берег.

Очутившись на полях Европейского театра военных действий, где войска союзников стремительно шли к победе, Вуди получил неожиданно позитивный опыт. «Это было замечательное время, — писал он. — Каждый день шел за месяц обычной жизни. Я понял, почему мужчины так очарованы войной. Пока ты побеждаешь и не несешь существенных боевых потерь, все хорошо». Он провел следующее лето в освобожденном Париже, где получил немало новых впечатлений, пребывая в атмосфере патриотической эйфории. "Самой потрясающей новостью, которую я когда-либо слышал, стало сообщение о том, что мы взорвали атомную бомбу, — писал Вуди. — Мы радовались, что такое мощное оружие находится в руках у нас, американцев, а не у наших врагов".

После окончания войны Вуди не мог дождаться возвращения к учебе. Он поступил в Университет Юты на математический факультет и окончил его за два с половиной года, а затем получил докторскую степень в Беркли. После учебы он устроился в Sandia Corporation в Нью-Мехико, где участвовал в госпроекте разработки ядерного оружия, работая бок о бок с таким светилами, как Станислав Улам — один из изобретателей водородной бомбы. В 1956 году Вуди полетел на Маршалловы острова, чтобы вести наблюдения за испытаниями ядерного оружия на атолле Эниветок. Некоторые острова этого атолла до сих пор страдают от радиоактивного загрязнения сильнее, чем Чернобыль или Фукусима. "Я был рад помочь дорогой родине оставаться сильнейшим государством в мире", — писал он.

В Sandia Вуди также сделал первые шаги в области обработки данных, которая затем станет его главной страстью. Его первые опыты написания кода были напрямую связаны со зловещими вычислениями для ядерных исследований. Одна из ранних работ Бледсо — "Программа для расчета вероятностей выпадения радиоактивных осадков при крупномасштабном термоядерном ударе" — позволяет спрогнозировать место выпадения радиоактивных осадков при ядерном ударе на основании взрывной мощности, времени детонации, координат центров взрыва и средней скорости ветра.

Все сильнее увлекаясь обработкой данных, Вуди заинтересовался автоматизированным распознаванием образов, в особенности машинным чтением — процессом обучения компьютера распознаванию немаркированных письменных знаков. Он объединил усилия с другом и коллегой Ибеном Браунингом — изобретателем-энциклопедистом, авиаинженером и биофизиком. Вместе они создали так называемый метод кортежей. Исследователи начали с проекции письменного знака — например, буквы Q, — на прямоугольную сеть ячеек, подобную листу бумаги в клетку. Каждой ячейке они присвоили двоичное значение: пустым — 0, а содержащим часть знака — 1. Затем ячейки случайным образом сгруппировали в упорядоченные пары. Теоретически такие группы могли включать любое число ячеек, отсюда и термин "кортеж" (англ. n-tuple). Посредством нескольких математических операций компьютер присваивал сетке со знаком уникальное значение. Теперь, встречая новый символ, он просто сравнивал его с другими сетками в своей базе данных, пока не находил наиболее точное совпадение.

Прелесть метода кортежей была в том, что он позволял распознать множество вариантов одного и того же знака: большинство букв Q получали значения, близкие друг к другу. А еще лучше было то, что метод работал не только с текстами, но и с другими изображениями. В эссе, написанном Вуди в соавторстве с математиком и давним другом Робертом С. Бойером, говорится, что метод кортежей помог им определить границы возможного в области распознавания образов. Он стал одной из первых попыток ответить на вопрос: "Как заставить машину действовать подобно человеку?"

Примерно в то же время, когда он занялся разработкой метода кортежей, Вуди впервые начал мечтать о создании машины, которую он назвал «компьютерной личностью». Много лет спустя он вспоминал, что испытывал "безумный восторг", воображая, на что может быть способен искусственный разум:

"Я хотел, чтобы он читал и печатные знаки, и рукописный текст. Он показывал бы мне прочитанное через маленькую камеру, закрепляемую на очках, а через встроенный наушник шептал бы имена друзей и знакомых, встреченных на улице. Потому что мой компьютерный друг мог бы распознавать лица…"

В 1960 году Вуди вместе с Браунингом и еще одним коллегой из Sandia создали собственную компанию — Panoramic Research Incorporated. Ее первой штаб-квартирой стал маленький офис в Пало-Альто в Калифорнии. Тогда это место еще никто не называл Кремниевой долиной. В то время большая часть компьютеров во всем мире — громоздких машин, хранящих данные на перфокартах или магнитных лентах, — располагалась в просторных офисах корпораций или в государственных лабораториях. Panoramic собственный компьютер был не по карману, поэтому компания арендовала машинное время у соседей. Чаще всего поздно вечером — так выходило дешевле.

Как Вуди потом рассказывал коллеге, Panoramic занималась "воплощением идей, которые, как мы надеялись, перевернут мир". По словам Нельса Уинклесса, писателя и консультанта, который участвовал в нескольких проектах Panoramic, а позднее стал первым редактором журнала Personal Computing, "они в буквальном смысле делали то, что другие люди считали слишком глупым".

Компания собрала под одной крышей странную, разношерстную команду ученых. Многие из них, как и Вуди, были нищими детьми Великой депрессии и теперь горели желанием попробовать все, до чего дотянутся руки. В числе их идей были и гениальные, и откровенно дикие. Браунинг, выходец из бедной фермерской семьи, который в юности провел два года, питаясь одной капустой, был неутомимым изобретателем-конструктором. Однажды он вместе с другим сотрудником Panoramic, Ларри Беллинджером, разработал концепцию "Дог-мобиля" — грузовика на собачьей тяге. Они также сконструировали небольшое устройство Hear-a-Lite в форме авторучки для незрячих, которое издавало разные звуки в зависимости от уровня освещенности.

Беллинджер, который в юности выполнял акробатические трюки на крыле самолета (и врал матери, объясняя синяки, полученные при неудачном парашютном прыжке, падением с велосипеда), также принимал участие в разработке Bell X-1 — сверхзвукового самолета с ракетным двигателем. Именно эту машину прославил Том Вулф в своем романе "Битва за космос". Позже Ларри создал Mowbot — самоходную газонокосилку, которая «стрижет траву совершенно хаотично и без вашего участия». (Устройство появлялось в шоу "Сегодня вечером" Джонни Карсона.)

А еще была Хелен Чан Вульф, основоположница программирования роботов, которая пришла в Panoramic через пару лет после колледжа. Она помогала программировать Шейки — "первого в мире робота с искусственным интеллектом", согласно описанию Института инженеров электротехники и электроники. Один из бывших коллег называл ее "леди Адой Лавлейс робототехники". В начале 1960-х код, написанный Вульф, выглядел, как стопки перфокарт, высота которых могла достигать полуметра. И ее просто поражали идеи, которыми фонтанировали ее коллеги в Panoramic. Так, однажды, по ее словам, "Вуди решил расшифровать код ДНК. Но понял, что с нынешними компьютерами это займет 30 или даже 37 лет. И я ответила: “Что ж, полагаю, этого мы делать не будем”.

Неудивительно, что Panoramic было трудно найти подходящих инвесторов. Вуди старательно презентовал свою технологию распознавания символов клиентам — в том числе страховой компании "Общество справедливого страхования жизни" и журналу McCall, но не мог заключить ни одного контракта. К 1963 году он был почти уверен, что компания разорится.

Однако у Panoramic на протяжении всей истории ее существования был по меньшей мере один надежный клиент, который помогал поддерживать ее на плаву, — Центральное разведывательное управление. Если в документах Вуди и содержались какие-то прямые отсылки к этому ведомству, они, скорее всего, сгорели дотла в мусорном баке у его гаража. Однако в его архивах сохранились частичные доказательства, дающие основания полагать, что Panoramic в течение многих лет сотрудничала с подставными компаниями ЦРУ. Уинклесс, который был в хороших отношениях со всеми сотрудниками Panoramic и всю жизнь дружил с Браунингом, считал, что компания, вероятно, и создавалась с расчетом на финансирование со стороны этого ведомства. "Никто мне об этом особо не рассказывал, — вспоминает он, — но так оно и было".

По данным Black Vault — веб-сайта, специализирующегося на публикации рассекреченных материалов в рамках Закона о свободе информации, Panoramic была среди 80 участников проекта MK-Ultra. Эта программа ЦРУ по "контролю сознания" стала скандально известной из-за психологических пыток, которым часто подвергались ничего не подозревающие испытуемые. Через подставной Фонд научных медицинских исследований Panoramic была задействована в подпроектах 93 и 94. Это были исследования бактериальных и грибных токсинов, а также "Направленное дистанционное управление поведением отдельных видов животных". Расследование, проведенное антропологом Дэвидом Г. Прайсом из Университета святого Мартина, показало, что Вуди и его коллеги также получали деньги от Общества изучения экологии человека. Эта подставная компания ЦРУ выделяла субсидии ученым, чьи исследования могли помочь ведомству усовершенствовать техники допроса или служили прикрытием для такой работы. ЦРУ не подтвердило, но и не опровергло свое знакомство или связь с Вуди или его компанией.

Однако была еще одна компания, которая финансировала самые важные исследования Вуди в Panoramic — King-Hurley Research Group. По информации из нескольких судебных исков, поданных в 1970-е, King-Hurley была компанией-пустышкой, через которую ЦРУ закупало самолеты и вертолеты для собственного секретного воздушного флота, известного как Air America. Кроме того, King-Hurley какое-то время финансировала психофармакологические исследования в Стэнфорде. Но до этого, в 1963 году, компания получила от некого Вуди Бледсо инвестиционное предложение совсем иного рода. Он предлагал исследовать «возможность технической реализации машины для упрощенного распознавания лиц». Взяв за основу разработанный им и Браунингом метод кортежей, Вуди планировал обучить компьютер распознавать 10 лиц. Иными словами, он хотел ввести в компьютер базу данных, состоящую из фото 10 человек, и проверить, сможет ли машина распознать их новые фотографии. "Мы верим, что скоро эти люди будут исчисляться тысячами", — писал Вуди. Через месяц King-Hurley дала ему зеленый свет.

Десять лиц — звучит не очень впечатляюще, не так ли? Но тогда, в 1963-м, это был фантастически амбициозный проект. Перейти от распознавания письменных знаков к распознаванию лиц означало сделать гигантский шаг вперед. Начнем с того, что тогда еще не существовало ни стандартных методов оцифровки фото, ни готовых баз данных с оцифрованными изображениями, на которые можно было опереться. Современные исследователи обучают свои алгоритмы на миллионах селфи, лежащих в свободном доступе, но Panoramic предстояло собрать базу данных с нуля, фотографию за фотографией.

И тут возникла большая проблема. Дело в том, что, в отличие от плоских букв, трехмерные лица живых людей подвижны. Портреты одного человека могут различаться поворотом головы, уровнем освещения, углом съемки. Люди стареют и меняют прически. На одних фото они выглядят расслабленными, а на других — тревожными. Исследователям требовалось как-то упорядочить эту вариативность и стандартизировать изображения, которые они сравнивали. Но сделать это было так же трудно, как найти общий знаменатель для огромной группы дробей. Вдобавок компьютеры, которые были в их распоряжении, едва ли подходили для такой задачи. Одной из основных машин в компании был CDC 1604 со 129 КБ оперативной памяти — в 21 000 раз меньше, чем у самого простого современного смартфона.

Прекрасно зная об этих проблемах, Вуди решил использовать подход «разделяй и властвуй», закрепив отдельные части исследования за разными специалистами Panoramic. Так, один молодой ученый занялся проблемой оцифровки. Для начала он сделал черно-белые снимки участников проекта на 16-миллиметровую пленку. Затем отсканировал их на специальном устройстве, изобретенном Браунингом, превратив каждую фотографию в десятки тысяч точек данных. Каждое значение обозначало яркость определенной части изображения в диапазоне от 0 (абсолютно темно) до 3 (очень светло) . Компьютер не смог бы обработать все эти данные за раз, поэтому исследователь написал программу под названием nublob. Она дробила изображения на фрагменты случайного размера и вычисляла для каждого из них значение по методу кортежей.

Тем временем Вуди, Хелен Вульф и еще один их коллега начали искать способ учитывать наклон головы при распознавании. Для начала они разметили кожу на левой стороне лица участника, от вершины лба до подбородка, сериями пронумерованных крестиков. Затем сделали два снимка, на одном из которых участник был снят анфас, а на другом — под углом 45 градусов к камере. Проанализировав расположение крестиков на обоих изображениях, исследователи смогли экстраполировать, как будет выглядеть то же самое лицо, повернутое на 15 или 30 градусов. В итоге они добились того, что, введя черно-белое фото размеченного лица в компьютер, могли получить на выходе автоматически сгенерированное изображение повернутой головы — составленное из точек, жутковатое, но достаточно точное.

Проработав над проектом тринадцать месяцев, команда Panoramic так и не смогла научить компьютер распознавать хотя бы одно лицо, не то что десять. Три фактора — длина волос, выражение лица и возраст — оказались «источником огромной вариативности», писал Вуди в своем отчете King-Hurley в марте 1964 года. По его словам, решение поставленной задачи находилось «за пределами возможностей современного распознавания образов и компьютерных технологий в целом». Однако он рекомендовал компании профинансировать дополнительные исследования, чтобы опробовать "совершенно новый подход" к решению проблемы распознавания лиц.

В течение следующего года Вуди пришел к пониманию: чтобы автоматизировать распознавание лиц, эффективнее всего свести лицо к набору связей между его основными участками: глазами, ушами, носом, бровями и губами. Придуманная им система была похожа на ту, что разработал в 1879 году французский криминалист Альфонс Бертильон, первым придумавший помещать в картотеки преступников их фото в профиль и анфас. Бертильон создавал описания людей, основанные на 11 физических измерениях, — таких как, например, длина левой ступни и расстояние от локтя до кончика среднего пальца. Поданная им идея заключалась в том, что при наличии достаточно большого количества параметров каждый человек становится уникальным. Метод оказался трудоемким, но рабочим: с его помощью в 1897 году французские жандармы опознали серийного убийцу Жозефа Ваше — за много лет до того, как мир узнал о дактилоскопии.

Весь 1965 год специалисты Panoramic провели в попытках создать полностью автоматизированную систему Бертильона для человеческих лиц. Они работали над программой, способной определять расположение носа, губ и других частей лица на основе анализа участков света и тени на фотографиях, но из этого по большей части ничего не вышло.

Тогда Вуди и Вульф начали разрабатывать так называемый человеко-машинный подход к распознаванию лиц. Он предполагал небольшое участие оператора в процессе сравнения изображений. (В недавно рассекреченной истории управления научно-исследовательских и опытно-конструкторских работ ЦРУ можно найти упоминание о подобном проекте за 1965 год. В том же году Вуди отправил письмо о распознавании лиц Джону Койперу, руководителю аналитического отдела этого подразделения.) Panoramic привлекла к работе с фотографиями Грегори, юного сына Вуди, и одного из его друзей. Мальчиков попросили просмотреть 122 снимка, на которых были представлены 50 человек, и сделать 22 измерения, включая длину уха от кончика до мочки и ширину рта от одного уголка до другого. Затем Вульф написала программу для обработки этих данных.

В конце эксперимента компьютер смог правильно соотнести каждый набор измерений с фотографией. Результаты получились скромные, но неопровержимые: Вульф и Вуди доказали, что система Бертильона теоретически работает.

Их следующим шагом, предпринятым в конце 1965 года, стало масштабирование эксперимента — на сей раз с использованием одной технической новинки, способной сделать работу человека в человеко-машинной системе намного более эффективной. За 18 000 долларов, выделенных King-Hurley, они приобрели планшет RAND. На этом устройстве размером со сканер исследователи могли с помощью стилуса создавать машиночитаемые изображения относительно высокого разрешения.

Вуди с коллегами попросили нескольких студентов обработать новую пачку фотографий: положить каждую на планшет и разметить стилусом расположение основных частей лица. Процесс по-прежнему оставался трудоемким, но шел гораздо быстрее, чем раньше. В общей сложности студентам удалось ввести в систему данные двух тысяч фотографий — минимум по две для каждого лица — со скоростью около 40 изображений в час.

Но даже работая с большей выборкой, команда Вуди столкнулась все с теми же проблемами. Например, компьютер по-прежнему испытывал трудности с улыбками, которые «искажали черты лица и существенно влияли на результаты измерений». Возраст также оставался проблемой, в чем Вуди убедился на примере собственного лица. Когда компьютеру предложили сравнить два фото Вуди — 1945 и 1965 годов, он озадачился. Машина увидела мало общего между юношей с широкой улыбкой и густыми темными волосами и угрюмым пожилым мужчиной с редеющей шевелюрой. Словно за прошедшие десятилетия он превратился в другого человека.

В каком-то смысле так оно и было. К тому времени Вуди устал от лихорадочного поиска новых контрактов для Panoramic и от "дурацкой ситуации, когда работы или слишком много, или недостаточно". Он продолжал неустанно предлагать инвесторам новые идеи, причем на современный взгляд не всегда этически однозначные. В марте1965 года — за 50 лет до того, как Китай начал использовать распознавание типа лица для идентификации уйгуров в провинции Синьцзян, — Вуди попросил управление перспективных исследовательских проектов Министерства обороны США, также известное как ARPA, поддержать новый проект Panoramic. Речь шла об исследовании возможности определения расовой принадлежности человека по характеристикам лица. "Существует огромное количество данных антропологических измерений, собранных по всему миру с участием людей разных рас, выросших в разных условиях, — писал он. — Этот обширный и ценный массив информации, с таким трудом накопленный за многие годы, не используется должным образом". Согласилось ли ARPA профинансировать этот проект, неизвестно.

Зато мы точно знаем, что Вуди вложил в Panoramic тысячи долларов из собственного кармана без какой-либо гарантии вернуть их назад. Между тем друг, работавший в Техасском университете в Остине, начал настойчиво звать его к себе, соблазняя обещаниями стабильной зарплаты. Вуди покинул Panoramic в январе 1966 года. Вскоре после этого компания прекратила свое существование.

Мечты о создании «компьютерной личности» по-прежнему не оставляли Вуди, и он с семьей переехал в Остин, чтобы полностью посвятить себя изучению и преподаванию автоматизации рассуждений. Однако его работа в области распознавания лиц на этом не завершилась, и апофеоз ее был уже близок.

В 1967-м, больше чем через год после переезда в Остин, Вуди принял участие еще в одном исследовании, связанном с распознаванием закономерностей в человеческих лицах. Целью эксперимента было помочь правоохранительным органам быстрее просеивать базы снимков преступников в поисках совпадений.

Как и раньше, проект спонсировало правительство Соединенных Штатов. В документе 1967 года, рассекреченном ЦРУ в 2005-м, упоминается некий "внешний контракт" на создание системы распознавания лиц, способной в сотни раз сократить время поиска изображений. На этот раз, судя по записям, деньги были проведены через посредника, которым выступило частное лицо. (В электронном письме этот предполагаемый посредник отказался от комментариев.)

Основным партнером Вуди по проекту стал Питер Харт — инженер-исследователь лаборатории прикладной физики Стэнфордского исследовательского института. (В 1970 году лаборатория отделилась от Стэнфордского университета, поскольку ее зависимость от финансирования военным ведомством вызывала у руководства кампуса много вопросов. Сегодня эта организация известна как SRI International.) Для начала Вуди и Харт создали базу из 800 изображений — по два снимка "газетного" качества на каждого из примерно "400 взрослых мужчин европеоидной расы". Фотографии различались возрастом модели и поворотом головы. (Я не видел в исследованиях Вуди ни снимков людей других рас и женщин, ни каких-либо упоминаний о них.) С помощью планшета RAND исследователи отметили на каждом фото 46 координатных точек, в том числе по пять на каждое ухо, семь на нос и по четыре на брови. Используя наработки Вуди в области нормализации вариаций в изображениях, они применили математическое уравнение, чтобы развернуть головы на фото в фас. Затем исследователи привели все изображения к одному стандартному размеру, использовав в качестве опорного критерия расстояние между зрачками.

Перед компьютером поставили задачу запомнить один вариант изображения каждого лица и распознать по нему второй. Вуди и Харт предложили машине два способа ее решения. Первый из них (так называемое сопоставление групп) предполагал, что компьютер разделит лицо на части — левую бровь, правое ухо и так далее, а затем сравнит относительные расстояния между ними. Второй подход опирался на байесовский механизм принятия решений. В нем компьютер делал предположение об изображении на основе данных 22 измерений.

В конечном счете обе программы справились с заданием одинаково хорошо. Более того — значительно лучше, чем люди. Когда Вуди и Харт попросили трех человек сопоставить наборы снимков 100 лиц, даже самому быстрому участнику потребовалось шесть часов, чтобы сделать это. Компьютер CDC 3800 справился с той же задачей в сотни раз быстрее — примерно за три минуты. Вуди и Харт признавали, что люди лучше различают лица в разных ракурсах и работают со снимками плохого качества, однако компьютер "значительно эффективнее" учитывал возрастные изменения. В итоге они пришли к выводу, что машина "превзошла" или "едва не превзошла" человека.

Это был лучший результат, которого Вуди достиг за все время своих изысканий в области распознавания лиц. Но это исследование также стало последним трудом, написанным Бледсо в данной сфере. По словам Харта, работа так и не была опубликована — "по государственным причинам", к огорчению обоих ученых. В 1970-м, через два года после завершения сотрудничества с Хартом, робототехник Майкл Касслер рассказал Вуди, что Леон Хармон из Bell Labs собирается провести исследование в области распознавания лиц. "Меня задевает, что это второсортное исследование будет опубликовано и его сочтут описанием лучшей из доступных человеко-машинных систем, — ответил Бледсо. — Думаю, даже если бы Леон как следует засучил рукава, то к 1975 году он бы все равно отставал от нас на 10 лет". Вероятно, Вуди был очень расстроен, когда несколько лет спустя исследование Хармона стало темой очередного выпуска журнала Scientific American, в то время как его собственная куда более прогрессивная работа лежала под замком.

В последующие десятилетия Вуди получит несколько наград за свой вклад в автоматизацию рассуждений и целый год будет занимать должность президента Ассоциации по развитию искусственного интеллекта. Однако его работа в области распознавания лиц останется непризнанной и почти забытой, а лавры достанутся другим.

В 1973 году технология распознавания лиц совершила огромный скачок благодаря японскому специалисту в области вычислительных систем Такэо Канадэ. Используя довольно редкие по тем временам материалы — базу данных из 850 оцифрованных снимков, сделанных по большей части во время международной выставки "Экспо-70" в японском городе Суйта в 1970 году, Канадэ разработал программу, которая могла самостоятельно, без участия оператора, выделять на лице нос, рот и глаза. Таким образом он смог, наконец, воплотить мечту Вуди, полностью устранив человека из человеко-машинной системы.

В дальнейшем Вуди еще раз или два пришлось использовать свои знания в области распознавания лиц. Так, в 1982 году он выступил приглашенным экспертом при расследовании уголовного дела в Калифорнии. Предполагаемого члена мексиканской мафиозной группировки обвиняли в совершении серии ограблений в округе Контра-Коста. В распоряжении прокурора было несколько улик, в том числе видео с камер наблюдения, которые запечатлели бородатого мужчину с длинными кудрявыми волосами в солнечных очках и зимней шапке. Однако на полицейских фото обвиняемый был гладко выбритым человеком с короткой стрижкой. Вспомнив свои исследования времен работы в Panoramic, Вуди измерил лицо грабителя банка и сравнил его с фотографиями обвиняемого. К радости защиты, Вуди обнаружил, что эти два лица, скорее всего, принадлежали разным людям, так как у них отличалась ширина носа. "Измерения никак не сходились", — сказал Бледсо. И хотя обвиняемый все равно отправился за решетку, показания Вуди помогли оправдать его по четырем статьям.

По словам Анила Джaйна, специалиста в области вычислительных систем из Мичиганского государственного университета и соавтора книги "Руководство по распознаванию лиц", эта технология только в последние 10 лет научилась хоть как-то адаптироваться к несовершенству реального мира. Почти все проблемы, с которыми столкнулся Вуди, уже решены. В первую очередь это стало возможным благодаря неисчерпаемым источникам цифровых изображений. "В социальных сетях вы можете найти столько лиц, сколько захотите", — говорит Джaйн. Развитие машинного обучения, увеличение емкости хранилищ и рост вычислительных мощностей позволили компьютерам эффективно самообучаться. Они собирают и анализируют огромные массивы данных, ориентируясь всего на несколько элементарных правил, и учатся сопоставлять с образцами все что угодно — от лиц до пачек чипсов, не нуждаясь при этом в планшетах RAND и бертильоновских измерениях.

С середины 1960-х технология распознавания лиц шагнула немыслимо далеко вперед, но именно Вуди очертил большинство проблем в этой области, которые решаются до сих пор. Например, созданный им процесс стандартизации положений лица все еще применяется исследователями. Для более точного распознавания лиц, говорит Джайн, глубокие нейросети часто поворачивают лицо в фас, экстраполируя новое положение на основе ключевых точек. И хотя современные системы на основе глубокого обучения не получают от программистов прямых указаний идентифицировать брови или носы, Вуди, который начал двигаться в этом направлении в 1965 году, установил курс развития технологии на десятилетия вперед. "Первые 40 лет метод, основанный на выделении отдельных черт лица, был для нас основным", — говорит Канадэ, ныне профессор института робототехники в Университете Карнеги — Меллон. Сейчас мы в каком-то смысле вернулись к первым попыткам Вуди разгадать загадку человеческого лица, когда он, используя метод кортежей, искал закономерности сходства среди огромного множества параметров. Современные системы распознавания лиц, по словам Джайна, при всей их видимой сложности, по сути просто вычисляют меру схожести для пар изображений и ищут лучший результат.

Весной 1993 года из-за дегенерации нейронов, вызванной БАС, речь Вуди постепенно начала превращаться в невнятное бормотание. В большой статье, написанной после его смерти, говорится, что он продолжал преподавать в Техасском университете, пока слушатели еще могли понимать его, и не бросал исследования в области автоматизации рассуждений, пока мог держать ручку. "До последних дней оставаясь ученым, — говорится в статье, — Вуди записывал свою речь на пленку, чтобы задокументировать развитие болезни". Он умер 4 октября 1995 года. В некрологе, размещенном в Austin American-Statesman, нет ни слова о его работе в области распознавания лиц. На фото седовласый Вуди, широко улыбаясь, смотрит прямо в камеру.

Оригинал -- статья в The Wired.

0
8 комментариев
Написать комментарий...
Tony Sib

Вуди - рановато родился - с таким открытием, которое решили придержать на след век) - если инфа правдивая) интересно в каких сферах ещё были такие энтузиасты, обогнавшие свое время

Ответить
Развернуть ветку
Лейтенант Кактус
Автор

Можно было бы сделать суперподборку.

Ответить
Развернуть ветку
Sam

Задублирован абзац "Они были там всегда..."

Ответить
Развернуть ветку
Лейтенант Кактус
Автор

Спасибо, поправил.

Ответить
Развернуть ветку
Jackson

интересная история,грустная немного

Ответить
Развернуть ветку
Лейтенант Кактус
Автор

Спасибо за отклик. После 50 просмотров я решил, что никто не читает лонгриды больше или история оказалось никому не интересна.

Ответить
Развернуть ветку
Камилла Хансулина

Удивительная биография сильного человека, правда есть несколько для меня трудных моментов, но и оспаривать, что человек был талантлив и оставил след в истории тоже бессмысленно. А ещё стало интересно, были ли подобные идеи разработки в Советском Союзе

Ответить
Развернуть ветку
Лейтенант Кактус
Автор

Да, про СССР и Россию тоже хочу написать.

Ответить
Развернуть ветку
5 комментариев
Раскрывать всегда