Создать искусственный интеллект, не уступающий человеку: насколько близка к этому компания DeepMind

Пока её система лучше всех играет в шахматы и го, но ориентируется в пространстве и обдумывает свои действия хуже человека

В 2010 году Демис Хассабис основал стартап DeepMind Technologies вместе с Шейном Леггом, с которым познакомился в Университетском колледже Лондона, и другом детства Мустафой Сулейманом.

Основатели, чтобы развить технологию ИИ, хотели попробовать междисциплинарный подход — объединение идей и достижений в области машинного обучения, нейробиологии, инженерии, математики, моделирования и вычислительной инфраструктуры.

В компанию инвестировали венчурные фонды Horizons Ventures, Founders Fund, а также Илон Маск и Скотт Банистер, соучредитель IronPort.

Команда DeepMind увидела потенциал в компьютерных играх, которые исследователи использовали для тестирования ИИ. Одна из их программ научилась играть в 50 различных игр Atari, а AlphaGo стала первой системой, победившей профессионального игрока в игре гo.

Слияние с Google

26 января 2014 года Google объявила о приобретении DeepMind Technologies. Сумма сделки составила от $400 до $650 млн. Покупка состоялась после того, как Facebook прекратила переговоры о приобретении компании в 2013 году. После покупки стартап стал называться Google DeepMind.

В начале сентября 2016 года DeepMind перешла в Alphabet, а из её названия исчезло упоминание Google.

Научные прорывы

AlphaZero и игра в шахматы, сёги и го

В конце 2017 года DeepMind представила AlphaZero, систему, которая самостоятельно овладевает игрой в шахматы, сёги и го. Шахматное сообщество отметило в играх AlphaZero новаторский, высокодинамичный и «нетрадиционный» стиль.

Неподготовленная нейронная сеть, обучаясь, играет сама с собой миллионы партий. Такой метод известен как обучение с подкреплением. Со временем AlphaZero учится на выигрышах, проигрышах и ничьих, корректируя параметры нейронной сети, что позволяет принимать правильные решения в следующих играх.

Количество тренировок, в которых нуждается сеть, зависит от стиля и сложности игры: около 9 часов для шахмат, 12 часов для сёги и 13 дней для го.

Количество продуманных шагов за один ход
Количество продуманных шагов за один ход

Обученную систему протестировали на сильнейших движках для шахмат (Stockfish) и сёги (Elmo), а также на предыдущей версии системы AlphaGo Zero, сильнейшем из известных игроков в го.

Stockfish и Elmo использовали 44 ядра процессора (как на чемпионате мира TCEC), тогда как AlphaZero и AlphaGo Zero использовали одну машину с четырьмя TPU первого поколения и 44 ядрами. Все матчи проводились с контролем времени: три часа на игру, дополнительные 15 секунд на каждый ход.

В каждой игре AlphaZero побеждала своего противника:

  • В шахматах AlphaZero победила Stockfish, чемпиона мира TCEC (девятый сезон) 2016 года, выиграв 155 и проиграв 6 игр из 1000.
  • В сёги AlphaZero победила версию Elmo, чемпиона мира CSA 2017 года, выиграв 91,2% игр.
  • В го AlphaZero победила AlphaGo Zero, выиграв 61% игр.
Создать искусственный интеллект, не уступающий человеку: насколько близка к этому компания DeepMind

По мнению DeepMind, для создания интеллектуальных систем, способных решать реальные проблемы, необходимо, чтобы они были гибкими и обобщали новые ситуации.

Системы, овладевающие конкретными навыками, часто не справляются даже со слегка изменёнными задачи. Умение AlphaZero учиться играть в шахматы, сёги и го демонстрирует, что алгоритм может получать новые знания в различных ситуациях.

В будущем, отмечают в DeepMind, это может помочь в создании системы ИИ для решения научных проблем.

Генеративная сеть запросов (DQN): игры Atari

Цель DeepMind — создать искусственных агентов, которые смогут достичь аналогичного человеку уровня производительности и универсальности.

Агенты структурируют и изучают данные, получаемые, например, с помощью зрения, благодаря глубокого обученным нейронным сетям. Для создания первых искусственных агентов в DeepMind впервые применили глубокое обучение с подкреплением (RL).

Агенты DeepMind постоянно выносят оценочные суждения, выбирая хорошие действия вместо плохих. Эти знания представлены Q-сетью, она оценивает общее вознаграждение, которое агент может получить после выполнения определённого действия.

В 2017 году DeepMind представила первый успешный алгоритм глубокого обучения с подкреплением. Ключевая идея — использование глубоких нейронных сетей для представления Q-сети и обучение её для прогнозирования общего вознаграждения.

Предыдущие попытки объединить обучение с подкреплением и нейронные сети были неудачными из-за нестабильного обучения. Чтобы устранить проблемы, алгоритм Deep Q-Network (DQN) хранит весь опыт агента, а затем случайно отбирает и воспроизводит этот опыт для предоставления разнообразных обучающих данных.

DeepMind применила DQN для обучения алгоритма играм для консоли Atari 2600. На каждом временном шаге агент наблюдает необработанные пиксели на экране, сигнал вознаграждения, соответствующий счёту в игре, и выбирает направление джойстика. DeepMind обучила отдельных агентов DQN для 50 различных игр Atari без какого-либо предварительного знания правил.

Создать искусственный интеллект, не уступающий человеку: насколько близка к этому компания DeepMind

DQN достигла человеческого уровня почти в половине из 50 игр. Исходный код DQN и эмулятор Atari 2600 находятся в свободном доступе.

Впоследствии DeepMind усовершенствовала алгоритм DQN:

Усовершенствования привели к 300-процентному улучшению среднего показателя в играх Atar; производительность на человеческом уровне достигнута почти во всех играх на этой приставке.

Компания также создала систему RL, известную как Gorila, которая использует платформу Google Cloud для ускорения обучения.

Позже DeepMind представила ещё более эффективный метод, основанный на асинхронном RL. Этот подход использует многопоточность стандартных процессоров.

Идея в том, чтобы одновременно создать множество агентов, но с использованием общей модели. Это обеспечивает жизнеспособную альтернативу опыту воспроизведения, поскольку распараллеливание также диверсифицирует и декоррелирует данные.

Асинхронный алгоритм Actor Critic, A3C, объединяет глубокую Q-сеть с политикой сети для выбора действий. Он использует часть времени обучения DQN и часть ресурсов Gorila. Создавая новые подходы к внутренней мотивации и временному абстрактному планированию, DeepMind достигла высоких результатов в «Мести Монтесумы».

DQN играет в Space Invaders
Создать искусственный интеллект, не уступающий человеку: насколько близка к этому компания DeepMind

В 3D-игре Labyrinth агент собирает данные из пикселей и своего непосредственного поля зрения; A3C достигает производительности на уровне человека во многих задачах. Он исследует карту, чтобы найти награды.

Альтернативный подход, основанный на эпизодической памяти, тоже оказался успешным.

Кроме того, DeepMind разработала ряд методов глубокого RL для задач непрерывного контроля вроде манипуляций с роботами и локомоции. Алгоритм детерминированных градиентов политик (DPG) обеспечивает непрерывный аналог DQN, используя дифференцируемость Q-сети для решения широкого спектра задач непрерывного контроля.

Асинхронный RL, дополненный стратегией иерархического управления, может успешно играть в «Муравьиный футбол» и «54-мерный гуманоидный слалом», — без предварительного знания динамики.

DeepMind разработала алгоритм RL, который изучает как сеть ценностей (которая предсказывает победителя), так и сеть политик (которая выбирает действия) при помощи игр с собой. AlphaGo объединила эти глубокие нейронные сети.

В октябре 2015 года AlphaGo стала первой программой, победившей профессионального игрока-человека в го. В марте 2016 года AlphaGo победила в го Ли Седола — сильнейшего игрока последнего десятилетия с 18 мировыми титулами.

Игра с Ли Седолом
Игра с Ли Седолом

Нейронная сеть с динамической памятью

В недавней статье DeepMind показала, как объединить нейронные сети и системы памяти для создания машин, которые хранят знания и рассуждают о них. Эти модели, дифференцируемые нейронные компьютеры (DNC), учатся на примерах, как нейронные сети, и хранят данные, как компьютеры.

Они задействуют память для ответа на вопросы о сложных структурированных данных, включая искусственно созданные истории, родословные и карты метро.

Также DeepMind показала, что алгоритм может решить головоломку с использованием обучения с подкреплением. Сейчас разработчики только начинают создавать нейронные сети, которые могут обдумывать ответ, рассуждать, используя знания.

В компьютере процессор считывает информацию из оперативной памяти (ОЗУ) и записывает в неё новую. ОЗУ даёт процессору гораздо больше места для организации промежуточных результатов вычислений. Временные заполнители называются переменными и хранятся в памяти.

Переменные содержат числовое значение. Структуры данных — переменные в памяти, содержащие ссылки, по которым можно переходить к другим переменным.

Одна из самых простых структур данных — список: последовательность переменных, которые можно читать по элементам. Например, можно сохранить список имён игроков в спортивной команде, а затем прочитать каждое имя по одному.

Более сложная структура данных — дерево. Например, в семейном древе можно переходить по ссылкам от детей к родителям, чтобы прочесть родословную.

Одна из самых сложных и общих структур данных — граф, подобный сети лондонского метро.

Проектируя DNC, разработчики хотели создать машины, которые могли бы научиться самостоятельно формировать сложные структуры данных и ориентироваться в них. В основе DNC лежит нейронная сеть, контроллер, аналогичный процессору в компьютере.

Контроллер отвечает за ввод данных, чтение, запись в память и за вывод-ответ. Память представляет собой набор местоположений, каждое из которых может хранить вектор информации.

Контроллер выполняет несколько операций с памятью: он выбирает, записывать данные в память или нет. Если он выбирает запись, информация хранится в неиспользованном месте или там, где содержатся данные, которые ищет контроллер. Это позволяет ему обновлять содержимое местоположения.

Если все места в памяти израсходованы, контроллер освобождает некоторые, как компьютер перераспределяет память, которая больше не нужна. Записывая что-то, компьютер отправляет вектор информации в выбранное место в памяти.

Каждый раз, когда информация записывается, местоположения связываются ссылками ассоциации, представляющими порядок, в котором информация была сохранена.

Создать искусственный интеллект, не уступающий человеку: насколько близка к этому компания DeepMind

На изображении нейронный сетевой контроллер (слева) получает внешние сигналы и на их основе взаимодействует с памятью, используя операции read или write. Чтобы контроллеру было проще перемещаться по памяти, DNC хранит «временные ссылки», следя за тем, что было написано, и записывает текущий уровень «использования» каждого местоположения памяти.

Когда DNC даёт ответ, DeepMind сравнивает ответ с желаемым правильным ответом. Со временем контроллер учится выдавать ответы, которые ближе всего к правильному ответу. В процессе он выясняет, как использовать память.

DeepMind хотела проверить DNC на проблемах, касающихся построения структур данных и использования их для ответов на вопросы.

DNC самостоятельно учится записывать описания и отвечать на вопросы о них. Когда DeepMind описывала станции и линии лондонского метро, разработчики могли попросить DNC ответить вопрос, как добраться из Моргате до Пикадилли.

Создать искусственный интеллект, не уступающий человеку: насколько близка к этому компания DeepMind

DNC обучался на случайно сгенерированных графах (на изображении слева). После исследователи проверили, сможет ли DNC правильно перемещаться в лондонском метро.

Используемые для определения графы сети показаны ниже вместе с примерами из двух видов задач:

  • «Путешествия»: найти правильную последовательность станций.
  • «Короткий путь»: найти самый короткий маршрут между двумя станциями.

На примере семейного древа DeepMind показала, что DNC может отвечать на вопросы, требующие сложных выводов. Описывая только отношения родителей, детей, братьев и сестер, разработчики спрашивали, например, кто предок Фрейи по материнской линии.

DeepMind также визуализировала, в каких местах памяти контроллер прочёл данные, чтобы дать ответ. Обычные нейронные сети в таких сравнениях не могли хранить информацию или научиться рассуждать, обобщая новые примеры.

WaveNet — генеративная модель для необработанного аудио

WaveNet способна генерировать речь, имитирующую любой человеческий голос. Эту же сеть, показала DeepMind, можно использовать для синтеза музыки.

Однако синтез речи, или преобразование текста в речь (TTS), — всё ещё сильно полагается на так называемую конкатенацию TTS, где большая база данных коротких фрагментов речи записывается одним диктором, а затем рекомбинируется для формирования полных высказываний.

Это затрудняет изменение голоса (например, переключение на другого говорящего или изменение акцента, эмоций) без записи новой базы данных. Появилась потребность и в параметрическом TTS, где вся информация, необходимая для генерации данных, хранится в параметрах модели, а содержимое и характеристики речи можно контролировать.

Пока параметрический TTS звучит менее естественно, чем конкатенационный. Существующие параметрические модели обычно генерируют аудиосигналы, пропуская выходы через алгоритмы обработки сигналов — вокодеры.

WaveNet же моделирует необработанную форму звукового сигнала напрямую, по одной выборке за раз. Наряду с более естественным звучанием речи использование необработанных сигналов означает, что WaveNet может моделировать любой вид звука, включая музыку.

WaveNets

Исследователи, как правило, избегают моделирования необработанного звука, потому что он воспроизводится быстро: 16 тысяч сэмплов в секунду или больше.

Построение полностью авторегрессионной модели, в которой на прогноз для каждой из этих выборок влияют все предыдущие (в статистике каждое прогнозное распределение обусловлено всеми предыдущими наблюдениями), — сложная задача.

Однако модели PixelRNN и PixelCNN, опубликованные в 2019 году, показали, что можно создавать сложные естественные изображения не только по одному пикселю за раз, но и по одному цветному каналу за раз. Это вдохновило DeepMind на адаптацию двумерных PixelNets к одномерной сети WaveNet.

Анимация показывает структурирование WaveNet. Это полностью свёрточная нейронная сеть. Свёрточные слои имеют различные коэффициенты расширения, которые позволяют рецептивному полю экспоненциально расти с глубиной и покрывать тысячи временных шагов.

Во время обучения входные последовательности представляют собой реальные сигналы, записанные от людей. После обучения можно попробовать сеть для генерации синтетических высказываний.

На каждом шаге выборки значение берётся из распределения вероятностей, рассчитанного сетью. Это значение затем подаётся обратно на вход, и создаётся новый прогноз для следующего шага. Создание сэмплов по одному шагу за раз требует больших вычислительных ресурсов, но DeepMind сочла это необходимым для создания реалистичного звука.

Компания обучила WaveNet, используя наборы данных TTS от Google в оценке производительности алгоритма.

На рисунке ниже — качество WaveNet для разных языков по шкале от одного до пяти по сравнению с лучшими современными системами TTS Google (параметрическими и конкатенативными), а также с человеческой речью, использующей средние оценки мнений (MOS).

MOS — стандартная мера для субъективных тестов качества звука. Как видно, сети WaveNet сокращают разрыв более чем на 50% как для английского, так и для китайского языков.

Создать искусственный интеллект, не уступающий человеку: насколько близка к этому компания DeepMind

Английский язык

Конкатенативный:

WaveNet:

Мандаринское наречие китайского языка

Параметрический:

Конкатенативный:

WaveNet:

Чтобы использовать WaveNet для преобразования текста в речь, нужно сообщить алгоритму, какой перед ним текст. Для этого DeepMind преобразует текст в последовательность лингвистических и фонетических функций (которые содержат информацию о текущей фонеме, слоге, слове и так далее) и подаёт её в WaveNet.

Таким образом, предсказания сети обусловлены не только предыдущими аудиосэмплами, но и текстом, который нужно произнести.

Поскольку WaveNet можно использовать для моделирования любого аудиосигнала, в DeepMind попытались сгенерировать музыку. В отличие от экспериментов TTS, разработчики не определяли для сетей входную последовательность, указывающую, что играть (например, музыкальное сопровождение); вместо этого алгоритму просто позволили генерировать всё, что он хочет.

GQN: представление и рендеринг нейронных сцен

В DeepMind считают: воспринимая визуальную информацию, человек видит нечто большее, чем просто картинку, мозг опирается на предварительные знания и рассуждения и делает выводы, которые выходят за рамки света, падающего на сетчатку.

Например, при первом входе в комнату человек мгновенно узнаёт элементы, которые в ней находятся, и место их расположения. Если он видит три ножки стола, он решит, что четвёртая ножка такой же формы и цвета, возможно, скрыта от глаз. Даже если человек не видит всё в комнате, он может представить её схему или оформление с другой точки зрения.

Эти визуальные и познавательные задачи кажутся людям простыми, но для искусственных систем они очень сложны. Современные системы визуального распознавания обучаются на больших наборах данных аннотированных изображений, созданных людьми.

Получение этих данных — дорогостоящий и трудоёмкий процесс, требующий маркирования каждого аспекта каждого объекта в каждой сцене набора данных. В результате часто захватывается только небольшое подмножество общего содержания сцены, что ограничивает системы искусственного зрения, обученные на таких данных.

Поскольку DeepMind разрабатывает более сложные машины, которые работают в реальном мире, компания хочет, чтобы они полностью понимали своё окружение: где находится ближайшая поверхность, из какого материала сделан диван, где находится выключатель.

В работе, опубликованной в журнале Science, DeepMind представила генерирующую сеть запросов (GQN), структуру, в рамках которой машины учатся воспринимать окружение, обучаясь только на данных, которые они сами получают, перемещаясь по сценам.

GQN учится, осмысливая наблюдения за окружающим миром. При этом GQN узнаёт о сценах и их геометрических свойствах без маркировки содержания сцен.

GQN состоит из двух сетей: сети представлений и сети генерации. Первая принимает наблюдения агента в качестве входных данных и создаёт представление (вектор), которое описывает базовую сцену. Вторая прогнозирует («воображает») сцену с ранее не наблюдаемой точки зрения.

Сеть представлений не знает, какие точки обзора создаст сеть генерации, поэтому она должна найти эффективный способ описания истинного расположения сцены с максимально возможной точностью. Это достигается захватом наиболее важных элементов вроде положения объектов, цвета и планировки помещения.

Во время обучения генератор узнаёт о типичных объектах, особенностях, отношениях и закономерностях в окружающей среде. Этот общий набор «концепций» позволяет сети представлений описывать сцену в очень сжатой, абстрактной манере, предоставляя сети генерации возможность при необходимости заполнять детали.

Например, сеть представлений будет представлять «синий куб» в виде небольшого набора чисел, и сеть генерации будет знать, как это проявляется в виде пикселей с определённой точки зрения.

DeepMind провела контролируемые эксперименты на GQN в процедурно-сгенерированных трёхмерных средах, содержащих несколько объектов в случайных положениях, цветах, формах и текстурах, с рандомизированными источниками света и сильной окклюзией.

После обучения в этих средах компания использовала сеть представлений GQN для формирования представлений о новых, ранее ненаблюдаемых сценах. В экспериментах DeepMind показала, что GQN проявляет несколько важных свойств:

  • GQN может «представить» ранее ненаблюдаемые сцены с новых точек зрения с высокой точностью. Когда GQN даётся представление сцены и новые точки обзора камеры, она генерирует чёткие изображения без какой-либо предварительной спецификации законов перспективы, окклюзии или освещения. Таким образом, сеть генерации — приблизительное средство визуализации, которое извлекается из данных.
  • Представительная сеть GQN может научиться считать, локализовать и классифицировать объекты без каких-либо меток уровня объекта. Несмотря на то что её представление может быть очень маленьким, прогнозы GQN с точки зрения запросов — точные и почти неотличимы от правды. Это подразумевает верность восприятия сети представлений, например в идентификации точной конфигурации блоков.
  • GQN может представлять, измерять и уменьшать неопределённость. Алгоритм способен учитывать её в своих представлениях о сцене, даже когда содержание видимо частично, и может комбинировать несколько частичных представлений сцены, чтобы сформировать целое. На картинке модель выражает свою неопределённость через изменчивость прогнозов, которая постепенно уменьшается по мере движения по лабиринту (серые конусы указывают места наблюдения, жёлтый конус указывает местоположение запроса).

GQN опирается на обширную литературу недавних работ по геометрии, генеративному моделированию, неконтролируемому обучению и прогнозному обучению.

Предлагаемый подход не требует специфичной для предметной области разработки или трудоёмкой маркировки содержимого сцен, что позволяет применять одну и ту же модель к ряду различных сред. В рамках подхода изучается и нейронный рендерер, способный создавать точные изображения сцен с новых точек зрения.

Метод DeepMind по-прежнему имеет много ограничений по сравнению с более традиционными методами компьютерного зрения, и в настоящее время он работает только на синтетических сценах.

Появление новых источников данных и улучшение аппаратных возможностей позволит компании исследовать применение инфраструктуры GQN для изображений с более высоким разрешением реальных сцен.

Реальное мировое воздействие

Выявление глазных заболеваний

DeepMind объявила о сотрудничестве подразделения DeepMind Health с офтальмологической клиникой Moorfields NHS Foundation Trust. Вместе они намерены лечить диабетическую ретинопатию и возрастную дегенерацию жёлтого пятна (ВДЖП). Эти болезни затрагивают более 625 тысяч человек в Великобритании и более 100 млн человек по всему миру.

По оценкам, каждый одиннадцатый взрослый в мире страдает диабетом. Диабет — основная причина слепоты среди населения трудоспособного возраста (с диабетом риск потери зрения выше в 25 раз). Раннее выявление и лечение могут предотвратить 98% серьёзной потери зрения из-за диабета.

Возрастная макулярная дегенерация (ВМД) — наиболее распространенная причина слепоты в Великобритании. Каждый день в Великобритании около 200 человек теряют зрение из-за серьёзной слепой формы этого состояния, и во всем мире число людей с ВМД должно вырасти почти до 200 млн к 2020 году.

Машинное обучение может помочь спасти зрение многих из этих людей — благодаря раннему выявлению ВМД.

По данным DeepMind, сегодня офтальмологи для диагностики и лечения этих заболеваний используют цифровое сканирование глазного дна (задняя часть глаза) и оптическую когерентную томографию (ОКТ).

Эти процедуры сложны и требуют много времени для анализа, что влияет на то, как быстро врачи могут встретиться с пациентами для обсуждения диагноза и лечения. Кроме того, традиционные инструменты компьютерного анализа не дают полной картины.

Исследовательский проект DeepMind направлен на изучение того, как машинное обучение сможет помочь эффективно и результативно проанализировать эти результаты сканирования. Это приведёт к раннему выявлению болезней и оказанию своевременной помощи.

Экономия энергии

В 2016 году DeepMind и Google совместно разработали систему рекомендаций на основе ИИ — для повышения энергоэффективности уже высоко оптимизированных центров обработки данных Google. Компании считают, что даже незначительные улучшения обеспечат значительную экономию энергии и уменьшат выбросы углекислого газа, что поможет бороться с изменением климата.

Центры обработки данных Google содержат тысячи серверов, на которых работают «Google Поиск», Gmail и YouTube.

Вместо рекомендаций, выполняемых человеком, их система искусственного интеллекта напрямую контролирует охлаждение центра обработки данных, оставаясь при этом под наблюдением людей.

<p>Каждые пять минут облачный ИИ извлекает снимок системы охлаждения центра обработки данных, представленный тысячами физических датчиков</p>

Каждые пять минут облачный ИИ извлекает снимок системы охлаждения центра обработки данных, представленный тысячами физических датчиков

<p>Информация поступает в глубокие нейронные сети, которые прогнозируют будущую энергоэффективность и температуру на основе предложенных действий</p>

Информация поступает в глубокие нейронные сети, которые прогнозируют будущую энергоэффективность и температуру на основе предложенных действий

ИИ выбирает действия, которые удовлетворяют ограничениям безопасности и минимизируют потребление энергии в будущем
ИИ выбирает действия, которые удовлетворяют ограничениям безопасности и минимизируют потребление энергии в будущем
<p>Оптимальные действия отправляются обратно в центр обработки данных, где локальная система проверяет их на соответствие собственным ограничениям безопасности перед внедрением</p>

Оптимальные действия отправляются обратно в центр обработки данных, где локальная система проверяет их на соответствие собственным ограничениям безопасности перед внедрением

DeepMind спроектировала агентов ИИ и основную инфраструктуру управления с нуля, используя восемь различных механизмов, чтобы система всегда работала как задумано.

Создать искусственный интеллект, не уступающий человеку: насколько близка к этому компания DeepMind

Одна из реализованных практик — оценка неопределённости. Для каждого потенциального действия — а их миллиарды, — агент ИИ рассчитывает её качество. Действия с низкой эффективностью исключаются из рассмотрения.

Другой метод — двухслойная проверка. Оптимальные действия, рассчитанные ИИ, проверяются по внутреннему списку ограничений безопасности, определённых операторами центров обработки данных.

Как только инструкции отправляются из облака в физический центр обработки данных, локальная система управления проверяет их на соответствие своему набору ограничений. Избыточная проверка гарантирует, что система остаётся в пределах локальных ограничений, а операторы сохраняют полный контроль над работой: в любой момент они могут перехватить управление у ИИ.

DeepMind намеренно ограничила оптимизацию системы рабочим режимом, чтобы расставить приоритеты в отношении безопасности и надёжности.

Несмотря на то что система работает всего несколько месяцев, она обеспечивает 30-процентную экономию энергии с ожидаемым улучшением: разработка становится лучше по мере увеличения количества данных.

Производительность измеряется с помощью общепринятого отраслевого показателя энергоэффективности охлаждения — кВт/т (или потребляемой энергии на тонну достигнутого охлаждения).

График отображает производительность ИИ с течением времени относительно исторической базовой линии до контроля ИИ

AlphaFold: использование ИИ для научных открытий

Благодаря междисциплинарному подходу к работе DeepMind объединила экспертов из области структурной биологии, физики и машинного обучения. Совместными силами компания надеется предсказать трёхмерную структуру белка, основываясь исключительно на его генетической последовательности.

Система AlphaFold базируется на исследованиях по использованию геномных данных в прогнозировании структуры белка. Трёхмерные модели белков, которые генерирует AlphaFold, гораздо точнее прежних.

Белки — большие и сложные молекулы. Почти каждая функция тела: сокращение мышц, восприятие света или превращение пищи в энергию — связана с одним или несколькими белками, их движением и видоизменением.

Функции белка зависят от его уникальной трёхмерной структуры. Например, белки антител, составляющие иммунную систему, имеют Y-образную форму. Привязываясь к вирусам и бактериям, они маркируют болезнетворные микроорганизмы для уничтожения.

Белки коллагена похожи на шнуры, они передают напряжение между хрящами, связками, костями и кожей.

Другие типы белков включают Cas9, которые, руководствуясь последовательностям CRISPR, действуют как ножницы: вырезают и вставляют участки ДНК; протеинам антифриза структура позволяет связываться с кристаллами льда и предотвращать замерзание организмов; рибосомы, которые действуют как запрограммированная сборочная линия, помогают создавать белки.

Но установить трёхмерную форму белка по его генетической последовательности — сложная задача, которую учёные не могут решить на протяжении десятилетий. Проблема в том, что ДНК содержит только информацию о последовательности строительных блоков белка, называемых аминокислотными остатками, которые образуют длинные цепи.

Способ складывания в трёхмерную структуру и есть «проблема сворачивания белка».

Чем больше белок, тем сложнее и труднее его моделировать, поскольку необходимо учитывать больше взаимодействий между аминокислотами. Как отмечалось в парадоксе Левинталя, перечисление всех возможных конфигураций типичного белка займёт больше времени, чем возраст Вселенной, прежде чем он достигнет правильной трёхмерной структуры.

Возможность предсказания формы белка имеет основополагающее значение для понимания его роли в организм и диагностики и лечения заболеваний, которые, как считается, вызваны неправильно свёрнутыми белками: фиброз Альцгеймера, Паркинсона, Хантингтона и кистозный фиброз. AlphaFold может улучшить понимание принципов работы тела, позволив учёным разрабатывать новые лекарства.

Последние 50 лет учёные определяли формы белков с помощью методов, не связанных с ИИ, например рентгеновской кристаллографии. Однако такие методы, по словам DeepMind, могут занимать долгие годы, так как предполагают большое количество проб и ошибок и стоят десятки тысяч долларов. Поэтому биологи обращаются к методам искусственного интеллекта в качестве альтернативы.

Геномика накопила много данных благодаря быстрому снижению стоимости генетического секвенирования. В результате подходы глубокого обучения к проблеме прогнозирования, основанные на геномных данных, становятся популярнее в последние несколько лет.

Результатом работы DeepMind над этой проблемой и стала AlphaFold, которую DeepMind представила на CASP в 2019 году.

Команда сфокусировалась на сложной задаче моделирования целевых форм с нуля, без использования белков в качестве шаблонов. Разработчики научились довольно точно прогнозировать физические свойства белковой структуры. После составления прогноза они задействовали два различных метода для построения уже полных белковых структур.

Оба этих метода опирались на глубокие нейронные сети, обученные предсказывать свойства белка по его генетической последовательности. Первый позволяет вычислить расстояния между парами аминокислот и углы между химическими связями, связывающими эти аминокислоты.

Создать искусственный интеллект, не уступающий человеку: насколько близка к этому компания DeepMind

Второй метод оптимизировал оценки посредством градиентного спуска — математического метода, обычно используемого в машинном обучении для внесения небольших, постепенных улучшений, — что делало структуры точнее.

Команды DeepMind

Успех DeepMind зависит от объединения множества команд для достижения общей цели. В компании пришли к выводу, что новые идеи возникают из целенаправленного междисциплинарного сотрудничества.

  • Группы исследователей и инженеров сотрудничают с партнёрами-экспертами по широкому кругу научных проблем — от сворачивания белков до квантовой химии, дополненной ИИ.
  • Исследователи и инженеры работают с партнёрами в Google, применяя системы в реальном мире. Это сотрудничество уже сократило энергопотребление Google.
  • В специализированные команды входят эксперты по управлению программами, развитию людей, путешествиям, недвижимости, участию общественности и многим другим, кто работает вместе, чтобы поддерживать, оптимизировать и развивать культуру DeepMind и мировые исследования.

Передача знаний новому поколению

Стипендиальная программа DeepMind даёт талантливым студентам из малообеспеченных семей возможность учиться в ведущих университетах и общаться с исследователями и инженерами DeepMind.

Компания сотрудничает с такими благотворительными организациями, как «Шахматы в школах и общинах» и In2Science, а также партнёрами-основателями Deep Learning Indaba в Африке, Восточноевропейской школы машинного обучения и летней лаборатории AI4Good в Канаде.

Компания сотрудничает с академическими институтами для расширения исследовательского и преподавательского потенциала. Сегодня DeepMind создала академические кафедры машинного обучения в Университете Альберты, Калифорнийском и Кембриджском университетах.

1111
4 комментария

Да че там у Рональдо? Вот там деньги, а тут му-хрю компьютер, играет во что-то и даже не в футбол

1
Ответить

Даниил, спасибо, крутой материал с хорошей подачей. Жаль, на вц не зашел, судя по просмотрам и комментам.

Ответить

Потому что неимоверно дерганый и скучный, сначала про одно, потом про другое. Начал читать, затем стал пролистывать. Статьи яндекса были интереснее, хотя там куда больше научной фантастики:)

1
Ответить

Ну тут технологии обсуждаются больше в разрезе получения бакинских, а технические потроха в общем-то тут редко жуются, с ними лучше на хабр

Ответить