{"id":14275,"url":"\/distributions\/14275\/click?bit=1&hash=bccbaeb320d3784aa2d1badbee38ca8d11406e8938daaca7e74be177682eb28b","title":"\u041d\u0430 \u0447\u0451\u043c \u0437\u0430\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u044e\u0442 \u043f\u0440\u043e\u0444\u0435\u0441\u0441\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u044b\u0435 \u043f\u0440\u043e\u0434\u0430\u0432\u0446\u044b \u0430\u0432\u0442\u043e?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"f72066c6-8459-501b-aea6-770cd3ac60a6"}

Компания DeepMind разработала нейросеть, способную выполнять более 600 задач

Британская исследовательская лаборатория DeepMind объявила о выпуске новой нейросети Gato. Разработчики описывают Gato как “систему общего назначения”, которую можно обучить выполнению множества различных типов задач. На данный момент нейросеть обучили 604 видам действий.

Image credit: DeepMind

В числе прочего, система умеет создавать описания к фотографиям и субтитры к видеозаписям, переписываться в чате, управлять роботизированной рукой и складывать с её помощью кубики, а также играть в игры на приставке Atari.

По словам научных сотрудников лаборатории, идея создания ИИ-системы, способной решать множество задач, не является инновационной. Однако большинство современных систем всё же направлены на работу над какой-то одной конкретной задачей или несколькими задачами из одной узкой сферы. Gato отличается от этих систем широким разнообразием решаемых задач, а также методов обучения.

Gato обучалась на множестве примеров: нейросеть запоминала миллиарды слов, реальных и смоделированных изображений, нажатий кнопок и движений в виде текстовых токенов. Токены представляли данные в доступном для системы виде - например, с их помощью ИИ мог определить принцип действий в видеоигре или понять, какое сочетание слов в предложении будет грамматически правильным и имеющим смысл.

Image credit: DeepMind

Система пока не совершенна, и не со всеми задачами справляется идеально. Например, она может периодически давать неверные или обрывистые ответы в диалогах, делать фактические ошибки в описании фотографий, а также промахиваться при складывании кубиков. Тем не менее, по утверждению разработчиков, из 604 задач Gato идеально выполняет около 450, а более половины из них - даже лучше профессионалов.

С точки зрения архитектуры Gato имеет общие характеристики с языковой программной моделью GPT-3 OpenAI. Обе нейросети имеют архитектуру Transformer, которая была разработана в 2017 году и считается предпочтительной для решения сложных задач вроде выполнения математических вычислений, написания музыки и классифицирования объектов.

При этом у Gato значительно меньше параметров - частей системы, определяющих навыки нейросети в выполнении каждой конкретной задачи. У Gato их всего 1,2 миллиарда, в то время как у GPT-3 - более 170 миллиардов. Как объясняют разработчики, низкое число параметров необходимо для того, чтобы система могла управлять роботизированной рукой в режиме реального времени. По их предположению, при увеличении числа параметров Gato смогла бы справиться “практически с любой задачей”.

Если вам понравилась статья, поделитесь ею в своем блоге или поставьте нам оценку, чтобы о проекте узнало как можно больше читателей!

0
1 комментарий
Вадим Д.

Беру в свой отдел!

Ответить
Развернуть ветку
-2 комментариев
Раскрывать всегда