{"id":14279,"url":"\/distributions\/14279\/click?bit=1&hash=4408d97a995353c62a7353088166cda4ded361bf29df096e086ea0bbb9c1b2fc","title":"\u0427\u0442\u043e \u0432\u044b\u0431\u0435\u0440\u0435\u0442\u0435: \u0432\u044b\u0435\u0445\u0430\u0442\u044c \u043f\u043e\u0437\u0436\u0435 \u0438\u043b\u0438 \u0437\u0430\u0435\u0445\u0430\u0442\u044c \u0440\u0430\u043d\u044c\u0448\u0435?","buttonText":"","imageUuid":""}

Компания DeepMind разработала нейросеть, способную выполнять более 600 задач

Британская исследовательская лаборатория DeepMind объявила о выпуске новой нейросети Gato. Разработчики описывают Gato как “систему общего назначения”, которую можно обучить выполнению множества различных типов задач. На данный момент нейросеть обучили 604 видам действий.

Image credit: DeepMind

В числе прочего, система умеет создавать описания к фотографиям и субтитры к видеозаписям, переписываться в чате, управлять роботизированной рукой и складывать с её помощью кубики, а также играть в игры на приставке Atari.

По словам научных сотрудников лаборатории, идея создания ИИ-системы, способной решать множество задач, не является инновационной. Однако большинство современных систем всё же направлены на работу над какой-то одной конкретной задачей или несколькими задачами из одной узкой сферы. Gato отличается от этих систем широким разнообразием решаемых задач, а также методов обучения.

Gato обучалась на множестве примеров: нейросеть запоминала миллиарды слов, реальных и смоделированных изображений, нажатий кнопок и движений в виде текстовых токенов. Токены представляли данные в доступном для системы виде - например, с их помощью ИИ мог определить принцип действий в видеоигре или понять, какое сочетание слов в предложении будет грамматически правильным и имеющим смысл.

Image credit: DeepMind

Система пока не совершенна, и не со всеми задачами справляется идеально. Например, она может периодически давать неверные или обрывистые ответы в диалогах, делать фактические ошибки в описании фотографий, а также промахиваться при складывании кубиков. Тем не менее, по утверждению разработчиков, из 604 задач Gato идеально выполняет около 450, а более половины из них - даже лучше профессионалов.

С точки зрения архитектуры Gato имеет общие характеристики с языковой программной моделью GPT-3 OpenAI. Обе нейросети имеют архитектуру Transformer, которая была разработана в 2017 году и считается предпочтительной для решения сложных задач вроде выполнения математических вычислений, написания музыки и классифицирования объектов.

При этом у Gato значительно меньше параметров - частей системы, определяющих навыки нейросети в выполнении каждой конкретной задачи. У Gato их всего 1,2 миллиарда, в то время как у GPT-3 - более 170 миллиардов. Как объясняют разработчики, низкое число параметров необходимо для того, чтобы система могла управлять роботизированной рукой в режиме реального времени. По их предположению, при увеличении числа параметров Gato смогла бы справиться “практически с любой задачей”.

Если вам понравилась статья, поделитесь ею в своем блоге или поставьте нам оценку, чтобы о проекте узнало как можно больше читателей!

0
1 комментарий
Вадим Д.

Беру в свой отдел!

Ответить
Развернуть ветку
-2 комментариев
Раскрывать всегда