OpenAI рассказала о разработке нейросети, которая научилась «дорисовывать» половину изображения

Модель ИИ создана на базе алгоритма GPT-2, который умеет заканчивать предложения и абзацы в англоязычных текстах

В феврале 2019 года исследовательская лаборатория OpenAI в Сан –Франциско объявила, что её модель искусственного интеллекта, основанная на алгоритме GPT-2, может писать последовательные и логичные отрывки текста на английском языке. Для этого человеку достаточно написать начало предложения или абзаца, а нейросеть продолжит мысль, пишет MIT Technology Review.

Система GPT-2 — это механизм прогнозирования. Он научился понимать структуру английского языка, просматривая миллиарды слов, предложений и абзацев, найденных в интернете. Обучившись, нейросеть смогла строить новые предложения, предсказывая правильный порядок слов.

Теперь OpenAI изучает, может ли нейросеть «дорисовывать» изображения. Специалисты заменили в системе слова на пиксели и обучили нейросеть на изображениях из ImageNet, популярном банке изображений для глубокого обучения.

Поскольку алгоритм был разработан для работы с одномерными данными — строками текста, исследователи развернули изображения в одну последовательность пикселей. Новая модель искусственного интеллекта, названная iGPT, смогла предсказывать, как должна выглядеть вторая половина изображения, учитывая последовательность пикселей в первой половине.

Левый столбец — исходные данные, крайний правый — оригинал, а средние столбцы — изображения, сгенерированные нейросетью

#нейросеть #искусственныйинтеллект

6 комментариев

Вик Григ

17.07.2020

Как нейросеть может такие вещи делать? Вот картину с нуля рисовать реально, а вот придумывать продолжение... как?? Как ИИ понимает что нарисовано, потом придумывает продолжение и чтоб все было более менее логично?? Не верю!

Ответить

Алексей Казаков

18.07.2020

А как твой мозг глядя на половину слона понимает, что это слон и нужна вторая половина? Тоже никто этого не понимает, но все знают, что так есть и значит это возможно