Самые значимые события в отрасли искусственного интеллекта в 2018 году

Перевод подборки технологических новинок от блога EvolutionOne.

Мы расскажем о последних достижениях в сфере ИИ в контексте основных игроков, задач и способов применения, а также коснёмся этических трудностей, с которыми приходится сталкиваться исследователям.

Сегодня, когда за ИИ всерьёз взялись сотни фирм, а ещё больше — планируют использовать эту технологию, довольно сложно выделить лидеров.

Если познакомиться с многочисленными рейтингами ведущих компаний, то Google, Facebook, Amazon, Microsoft и IBM неизбежно окажутся на вершине (чуть реже говорят об Apple, Tencent и Baidu). Мы остановимся на Google и Microsoft, поскольку в 2018 году они чаще других мелькали в новостях, связанных с ИИ.

С точки зрения ИИ 2018 год для Google оказался продуктивным, что показывают и линейка новых продуктов, и улучшения действующих сервисов.

Больше всего новинок компания представила на ежегодной майской конференции для разработчиков Google I/O: «умную» группировку для Gmail, обновления карт и виртуальный помощник Google Duplex (полный список представленных разработок — по ссылке).

Генеральный директор Google Сундар Пичаи демонстрирует возможности Google Duplex

Запись звонка Duplex в парикмахерскую оказалась настолько впечатляющей, что некоторые даже задумались, не прошла ли система тест Тьюринга (нет, не прошла; человек, принимающий решение, должен знать, что он, возможно, говорит с виртуальным помощником).

Кроме того, презентация вызвала споры о порядочности такого применения технологии, ведь человеку на другом конце не дали понять, что он общается с ботом. В скором времени обсуждения, похоже, разгорятся вновь: в декабре 2018 года Duplex стал доступен небольшому числу пользователей.

AlphaZero против сильнейших движков для игры в шахматы, сёги и го. Зелёным цветом отмечены победы AlphaZero, серым — ничейные партии, розовым — поражения

Компания DeepMind, принадлежащая Alphabet, в 2018 году добилась впечатляющих результатов в разработке игровых движков — программа AlphaZero превзошла все сильнейшие системы для игры в шахматы, сёги и го.

Особенно занимательно, что AlphaZero не изучала партии, сыгранные людьми, а научилась играть сама, опираясь на основные правила. Как оказалось, действуя без ограничений, появляющихся при анализе сыгранных партий, AlphaZero развила «очень динамичный, новаторский и необычный стиль игры». Словом, сообществу есть чему у неё поучиться.

Вместе с тем DeepMind работает над созданием систем, которым по силам задачи с неполной информацией, в частности AlphaStar — программой для игры в StarCraft II, уже одержавшей несколько побед над профессиональными игроками. (Прежде ИИ с трудом играл в эту стратегию из-за её сложности.)

Благодаря машинному обучению камера Google Pixel высветляет тёмные снимки Google

В вычислительной фотографии ИИ добился наиболее ощутимых результатов, по крайней мере с точки зрения потребителя. За последние несколько лет эта технология сильно продвинулась вперёд (в 2015 году Google Photos научилось автоматически отмечать и распределять снимки, а iPhone 7 в 2016 году — размывать фон на фотографиях в портретном режиме), однако в 2018 году множество впечатляющих разработок вышли в массовое производство.

Среди них — «ночное зрение» на телефонах Google Pixel и «умный» HDR на iPhone XS и XS Max. Эти функции со всей ясностью показывают умение ИИ преодолевать физические ограничения камер.

Другая сторона вычислительной фотографии — обработка изображений нейронной сетью, после которой они становятся похожими на полотна известных художников, например Ван Гога или Моне. Похожие идеи используются в машинном зрении и даже беспилотных автомобилях.

Как и Google, Microsoft на полном ходу включилась в ИИ-гонку, представив немало продуктов и обновлений. Значительная часть работы была нацелена на создание более совершенных инструментов для разработчиков ИИ-решений на базе облачной платформы Microsoft.

Занятно, что главная конференция Microsoft под названием Build проводится в мае, в одно время с Google I/O. В прошлом году она приняла много гостей, а компания объявила об интеграции проекта Brainwave в систему машинного обучения Azure.

Проект Brainwave (прежде Catapult) стал результатом исследований, начатых в Bing в 2010 году; впервые о нём рассказали в августе 2017 года на Hot Chips, одной из ведущих конференций по полупроводникам.

Вкратце: Brainwave — аппаратная платформа на ПЛИС-чипах, разработанная для ускорения ИИ-вычислений в реальном времени, что крайне важно для поисковых движков (понятно, почему проект зародился в Bing). Теперь же, встроив Brainwave в Azure, Microsoft утверждает: Azure — самая эффективная облачная платформа для искусственного интеллекта.

На Ignite компания выпустила Cortana Skills Kit для бизнеса. Microsoft хочет протестировать ИИ-ассистенты в офисном пространстве — представьте, что вы можете написать бота, который самостоятельно назначит время для уборки офиса или отправит запрос в службу поддержки, руководствуясь краткой голосовой командой.

В сентябре 2018 года Microsoft дополнила SwiftKey, приложение-клавиатуру на Android, опцией перевода в реальном времени. Наконец, вслед за Google Duplex, компания представила набор инструментов Speech Services с усовершенствованным механизмом преобразования текста в речь.

В ноябре 2018 года состоялась презентация контейнеров Cognitive Services; они созданы с прицелом на периферийные вычисления — обработку данных у границы сети, а не в облаке, что позволяет избежать задержек и оптимизировать затраты. С их помощью разработчики cмогут дополнить приложения ИИ-алгоритмами на месте и без глубоких знаний в теории данных.

В последнее время инвестиции в искусственный интеллект значительно выросли, хотя сложно определить, насколько, пишет Crunchbase.

Издание CB Insights разделило лидирующие ИИ-стартапы по категориям; оказалось, в 2018 году больше всех инвестиций привлекли китайские компании SenseTime и Face++ ($1,6 млрд и $0,6 млрд соответственно), а из 11 «единорогов» с общей оценкой в $20 млрд пять фирм — китайские, и на них приходится половина этой суммы (лидирует SenseTime с капитализацией $4,5 млрд).

Китай движется быстрее остальных. К тому же зона интересов страны расширяется, и постепенно она превращается в мировой центр ИИ-разработки.

Речь комика Джордана Пила, наложенная на обращение Барака Обамы

В декабре 2017 года Motherboard опубликовало историю пользователя Reddit под ником deepfakes; он публиковал на сайте порно, в котором заменил лица порноактёров на лица знаменитостей. И хотя наложение было некачественным, ролики оказались вполне реалистичны, учитывая, что они были сделаны силами одного человека.

Технологии замены лица, задействованные в поддельных роликах, существуют довольно давно, тогда как лёгкость их создания и качество наложения в 2018 году перешли на новый уровень.

Производство — относительно безобидно, в отличие от распространения ложных новостей или пропаганды. Время покажет, разрешима ли проблема, но отличить deepfake-видео от подлинных материалов будет всё сложнее — это факт.

«Распознавание лиц: время действовать» <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fblogs.microsoft.com%2Fon-the-issues%2F2018%2F12%2F06%2Ffacial-recognition-its-time-for-action%2F&postId=59240" rel="nofollow noreferrer noopener" target="_blank">Microsoft</a>

За последние несколько лет самостоятельное обучение алгоритмов и обучение под присмотром дали хорошие результаты (примером первого служит AlphaZero). Тем не менее большая доля прикладных задач требует обучения на размеченных данных, нередко сдерживая прогресс.

Между тем большой набор размеченных данных не равен хорошему набору данных. Дело в следующем: нейронные сети, обучающиеся под присмотром, хороши ровно настолько, насколько хороши данные в основе. Поэтому если в них есть недостатки (скажем, ориентация на одну характеристику в ущерб другим), велик шанс, что нейронная сеть подхватит и усилит необъективность. 2018 год показал потенциальную глубину проблемы.

Так, Джой Буоламвини, исследовательница из MIT Media Lab, обнаружила: системы распознавания лиц от Microsoft, IBM и Megvii, определяя пол белых мужчин, ошиблись лишь в 1% случаев, а в случае темнокожих женщин — в 35%.

Эти модели обучались на базах, в которых фотографий белых мужчин было больше. С учётом того, что сегодня распознаванием лиц всё активнее пользуются правоохранительные органы, а в базах данных фотографий под арестом афроамериканцев несоразмерно много, перекос может привести к серьёзным последствиям.

Другой расхожий пример — поведение системы по подбору персонала Amazon. С помощью машинного обучения компания хотела сделать этот процесс более эффективным, частично его автоматизировать. Однако система обучалась на резюме прежних соискателей, большинство из которых — мужчины.

В результате она уловила этот сдвиг и научилась понижать статус кандидатов-женщин, выставляя на первый план качества вроде «маскулинного общения». В конце концов Amazon отказалась от разработки, но немало фирм, пытающихся задействовать ИИ в найме, могут столкнуться с похожими результатами.

Сегодня всё больше людей и компаний призывают власти к созданию нормативной базы для управления распознаванием лиц. Минимальный контроль появится в скором времени.

Беспилотный автомобиль Uber Volvo XC90 <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.technologyreview.com%2Fs%2F610574%2Fwhat-ubers-fatal-accident-could-mean-for-the-autonomous-car-industry%2F&postId=59240" rel="nofollow noreferrer noopener" target="_blank">MIT Technology Review</a>

Даже лучшие технологии, работая в сложных непредсказуемых условиях, рано или поздно дают сбой. Это и произошло 18 марта 2018 года — беспилотник Uber насмерть сбил пешехода в Темпе, Аризона. Авария заставила компанию приостановить все тесты и спровоцировала бурные обсуждения беспилотных машин, этических и правовых трудностей, которые необходимо решить, чтобы автомобили без водителя заслужили доверие общества.

Через девять месяцев Uber разрешили возобновить испытания в Питтсбурге, а затем в Сан-Франциско и Торонто, хотя и с существенными ограничениями по типу дорог и погодным условиям.

От Uber потребовали перехода на более тщательную систему обучения водителей, поскольку в ходе расследования мартовского происшествия выяснилось, что водитель отвлёкся и не следил за дорогой. Фирма дополнила платформу для беспилотников сторонней системой контроля водителей.

Несчастный случай с Uber только спровоцировал споры о безопасности. В одном можно быть уверенным почти наверняка: следующие два-три года станут поворотными в формировании общественного мнения о беспилотных автомобилях.

15 октября 2018 года Массачусетский технологический институт (MIT) объявил о создании колледжа обработки данных имени Стивена Шварцмана, основателя и генерального директора Blackstone. Он передал MIT $350 млн. Новое подразделение будет заниматься перспективами и угрозами, которые открывает миру развитие ИИ.

Впрочем, институт и так может похвастаться крепкой репутацией в отрасли (его сотрудники стояли у истоков технологии в конце 1950-х годов). Дар Шварцмана позволит удвоить количество исследователей, занимающихся искусственным интеллектом и обработкой данных при MIT.

Помимо этого, внимания заслуживают изучение современной политики и этики для сознательного применения ИИ, а также упор на междисциплинарное сотрудничество. И хотя за последние несколько лет сложилось немало «фабрик мысли» и исследовательских инициатив, вовлечённость MIT не может не радовать: работы ещё очень много.

#машинноеобучение #искусственныйинтеллект

Самые значимые события в отрасли искусственного интеллекта в 2018 году

Google

Вычислительная фотография

Microsoft

Инвестиции

Этика, регулирование и образование