Как определить сгенерированное изображение: Полное руководство

Сгенерированные изображения повсюду, и с каждым днем они становятся все более реалистичными. Вот как их всегда можно распознать.

Как определить сгенерированное изображение: Полное руководство

Генераторы изображений становятся все более пугающе хорошими.

И в ближайшее время они станут еще лучше. Изучение признаков ИИ-изображений сейчас очень важно, чтобы вы могли использовать их в будущем. Хотя с каждым днем распознать их становится все труднее, эта статья посвящена самым простым способам идентификации AI-изображений, и к ее концу, я уверен, у вас разовьется интуиция!

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Дело движется быстро. Вот только два года работы генератора изображений MidJourney:

Как определить сгенерированное изображение: Полное руководство

Несмотря на то что технологии развиваются бешеными темпами, я уверен, что определить, является ли любое изображение сгенерированным ИИ, можно (пока что).

Прежде чем мы погрузимся в работу, я дам вам один совет, который помогает всегда, независимо ни от чего:

Просто увеличьте изображение!

Признаки искусственного интеллекта

В этой статье я подробно расскажу о каждом из следующих признаков и приведу примеры, которые помогут вам определить сгенерированные изображения.

  1. Фоновые объекты, которые не имеют смысла
  2. Несоответствующие/нереалистичные текстуры и узоры
  3. "Непонимание" формы или функции объекта
  4. Странный текст

Давайте перейдем прямо к делу!

Признак 1: фоновые объекты, которые не имеют смысла

Начнем с того, что это один из самых быстрых способов определить, что изображение сгенерировано ИИ.

ИИ любит "фокусироваться" на главном объекте в сцене, демонстрируя свою способность детализировать наиболее важный объект. Однако он часто "забывает" обратить внимание на фон изображения. Вот отличный пример этого:

Как определить сгенерированное изображение: Полное руководство

На первый взгляд это выглядит вполне реально. Однако не сразу можно заметить, что связность изображения начинает нарушаться. Например, что происходит с "мостом" на заднем плане?

Как определить сгенерированное изображение: Полное руководство

Как видите, кабели и колонны на мосту совершенно бессмысленны и явно не служат опорой.

Во-вторых, этот "другой поезд" на заднем плане не имеет абсолютно никакого смысла и выглядит как чье-то плохое воспоминание о вагоне поезда:

Как определить сгенерированное изображение: Полное руководство

Вот еще один пример. Эта фотография выглядит вполне реальной, то есть пока мы не посмотрим на задний план:

Как определить сгенерированное изображение: Полное руководство
Как определить сгенерированное изображение: Полное руководство

Как видите, при увеличении масштаба из земли торчат, казалось бы, случайные артефакты, ветви деревьев невероятной длины и аморфная, непонятная "штука" в середине справа.

Признак 2: непоследовательные/нереалистичные текстуры и узоры

Это полезно, когда фон размыт или недостаточно детализирован, и особенно полезно для знакомых вам текстур, таких как кожа, ткань, камень, металл и другие поверхности. Вот пример:

Как определить сгенерированное изображение: Полное руководство

Эта фотография выглядит невероятно реалистично; на самом деле, если бы вы просматривали социальные сети и взглянули на это изображение, я готов поспорить, что вы не определили бы, что оно сгенерировано ИИ. Кроме того, здесь очень мало фоновых странностей, так что как мы можем это определить?

Давайте начнем с увеличения.

1-й признак: Кожа

Сгенерированная ИИ кожа обычно не соответствует реальной, особенно если приблизить ее. Увеличив масштаб, мы видим, что текстура кожи здесь просто выглядит ненатуральной:

Как определить сгенерированное изображение: Полное руководство

Ее кожа кажется почти пластиковой, неестественной и слишком гладкой. Здесь не видно ни одной поры! Зоны перехода, такие как верхняя губа и под носом, кажутся почти нарисованными. Вы также заметите, что отдельные волоски не соединены между собой, а некоторые парят в пространстве.

Вот еще один пример "странной" кожи на другом изображении:

Как определить сгенерированное изображение: Полное руководство

Кожа здесь имеет довольно неестественный вид, не так ли? Не говоря уже о случайных вкраплениях и удлинении волос...

Признак 2: Текстура одежды + детали

Одежда на сгенерированных изображениях часто выглядит реалистично издалека, но при ближайшем рассмотрении становится ясно, что что-то не так. Давайте посмотрим на другую деталь на первом изображении:

Как определить сгенерированное изображение: Полное руководство

Здесь есть множество вещей, которые являются неправильными:

  1. Вязаный шарф на самом деле представляет собой странный псевдо-полосатый узор, не похожий на какую-либо узнаваемую текстуру ткани.
  2. Молния проходит сквозь шарф.
  3. Пуговица неправильной формы и аморфная

Если вы посмотрите на другие примеры одежды, созданной ИИ, это станет еще более очевидным:

Как определить сгенерированное изображение: Полное руководство

У этой фотографии свитера крупной вязки есть несколько проблем. Блуждающие "волоски", которые вы ожидаете увидеть на свитере, непоследовательны и бессмысленны. Если присмотреться, некоторые нити уходят в никуда и сливаются друг с другом, не являясь настоящей вязкой. Кроме того, края оплетенных нитей расположены как бы случайно.

Вот последний пример: джинсовая куртка.

Как определить сгенерированное изображение: Полное руководство

Опять же, вместо видимых нитей мы имеем узор в горошек. Кроме того, в золотистых нитях есть случайные детали, которые не имеют абсолютно никакого смысла.

Признак 3: Глаза

Глаза, сгенерированные ИИ, все еще немного странные, даже сегодня. На оригинальном изображении вы можете увидеть это вблизи:

Как определить сгенерированное изображение: Полное руководство

Веки здесь толстые и почти кукольные, а радужные оболочки (особенно левого глаза) плавают в пространстве, почти вытянутые. Ее ресницы также потрепаны и отсутствуют на некоторых участках век.

Вот еще один пример, еще более жуткий:

Как определить сгенерированное изображение: Полное руководство

Зрачки не по центру, а радужки явно неправильной формы. Не говоря уже о том, что кожа здесь опять же не имеет смысла: ее текстура выглядит неправильно.

Этих признаков, как правило, достаточно, чтобы определить, что изображение человека сгенерировано ИИ, но впереди еще больше!

Признак 3: "Непонимание" формы или функции объекта

ИИ на самом деле не знает, как все устроено. Когда он генерирует изображение, он не задумывается о том, как объект взаимодействует с чем-то, что не находится в его окружении. И снова это особенно заметно для фоновых объектов.

Как определить сгенерированное изображение: Полное руководство

Выглядит как красивая кухня, верно? Нет. Давайте увеличим масштаб.

Ах да, куча "кухонных принадлежностей". Можете ли вы опознать хоть одну из них?

Как определить сгенерированное изображение: Полное руководство

Бутылка "оливкового масла" на грани падения на плиту...

Как определить сгенерированное изображение: Полное руководство

Горшок с растением с невидимыми корнями?

Как определить сгенерированное изображение: Полное руководство

Контейнеры, которые совершенно не подходят по всем параметрам...

Как определить сгенерированное изображение: Полное руководство

Кстати, каким-то образом я зашел так далеко в статье, даже не упомянув о том, что ИИ все еще очень плох в генерации рук. Если присмотреться, то почти у любой руки, сгенерированной ИИ, можно обнаружить несоответствия:

Как определить сгенерированное изображение: Полное руководство

Выглядит неплохо, правда? А может, и нет:

Как определить сгенерированное изображение: Полное руководство

Да, становится ясно, что ИИ на самом деле не знает, как работает что-либо в реальном мире. Всегда будьте начеку!

Признак 4: странный текст

Хотя некоторые генераторы изображений ИИ, такие как Dalle3, могут добавлять текст к изображениям, сгенерированное ИИ изображение выдает себя, если на нем есть искаженный текст или логотипы. Вот хороший пример:

Как определить сгенерированное изображение: Полное руководство

Это выглядит почти по-настоящему (даже несмотря на пять чашек кофе), но текст на чашках абсолютно бессмысленный:

Как определить сгенерированное изображение: Полное руководство

Вот еще один пример: витрина магазина (изображение не слишком реалистичное, но я просто показываю, что текст сгенерированного изображения может быть хорошо смотреться издалека):

Как определить сгенерированное изображение: Полное руководство

Как видите, на первый взгляд крупная надпись выглядит нормально, но когда мы немного увеличиваем масштаб других элементов...

Как определить сгенерированное изображение: Полное руководство

Надпись просто странная и непонятная. Это явно не текстура или что-то вроде искусства; она "пытается" быть надписью, но у нее просто не получается.

Это четыре самых важных фактора для определения изображений ИИ! Надеюсь, это поможет. Давайте попробуем использовать некоторые из этих знаний на наглядных примерах.

Просто для развлечения: Несколько действительно сложных примеров

Здесь собраны сгенерированные ИИ изображения, которые очень сложно распознать даже с первого взгляда. Только при увеличении масштаба мы можем увидеть суть...

Разбившийся Cybertruck:

Как определить сгенерированное изображение: Полное руководство

Ух ты, выглядит очень реалистично. Хм, вообще-то... попался!

Как определить сгенерированное изображение: Полное руководство

Селфи в 2012 году:

Как определить сгенерированное изображение: Полное руководство

Это действительно хорошее изображение; единственное, что выдает ИИ, - "логотип" футболки.

Как определить сгенерированное изображение: Полное руководство

Фотография в ресторане:

Как определить сгенерированное изображение: Полное руководство

Это очень сложно определить, особенно на маленьком экране. Но, как всегда, мы должны увеличить.

Как определить сгенерированное изображение: Полное руководство

Я постарался сделать эту статью как можно более полной, не упуская ни одного момента, и надеюсь, что она станет хорошей отправной точкой для тех из вас, кто хочет уметь определять сгенерированные изображения.

В следующий раз, когда вы будете листать соцсети и увидите что-то, что выглядит немного не так, не забудьте увеличить масштаб.

Спасибо за чтение!

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Оригинал статьи на английском - здесь.

5151
34 комментария

любой человек который пользуется интернетом больше двух часов в день может с легкостью отличить сгенерированный контент при чем не только изображения от реального

3
Ответить

Как примитивно вы размышляете, вы скорее всего никогда не генерировали самостоятельно изображения!

4
Ответить

Абсолютно нет. Даже взять пример с кожей. Многие специально свою так обрабатывают фильтрами, чтоб она была как лист гладкой. И как тут отличить. Читая разобранные примеры, даже в них не до конца понятно, например фон. Ну мазня какая-то на фоне, кто в это вглядывается, тем более это пиксели,а не четкая картинка

2
Ответить

Сможет, но в том случае, если не сделана постобработка изображения.

Ответить

Селфи в 2012 году

Логотип футболки в таком кач-ве - спорное док-во.
Там вообще может быть какая-то абстракция.
Я обратил внимание на несоответствие цвета растительности на лице: щетина, скорее, коричневая, а волосы на бороде - чёрные. Впрочем, возможно, такое у людей встречается , или же мужчина подкрашивал бороду.

Фотография в ресторане:

Аналогично: неясно, какой шрифт и язык. Может, так и задумано?
Но в этой фотографии у мужчины на переднем праве что-то не то с пальцами левой руки - они какие-то неестественно длинные. Впрочем, возможно, у него какой-то дефект, и он специально руку спрятал.

С изображением поезда тоже не всё так однозначно.
1. Возможно, там на дальнем плане, не мост, а ... башенный кран?
2. Странный вагон на заднем плане может быть не вагоном , а частью чего-то другого железнодорожного, возможно, в процессе демонтажа и/или после аварии.
На этой картинке ещё вопрос вызывает отсутствие щели в стыке между рельсами - на переднем плане (у ближайшей рельсы) он как-будто должен быть.
И, странно, что вы не заклеймили надпись на табло вагона - там же тоже что-то нечитаемое :)

Легко и приятно искать дичь, если заведомо известно, что изображение сгенеровано нейросетью.
Допускаю, что набив руку, можно определять реальность изображения на глазок, но в типовых случаях (реклама и прочий маркетинг) это смысла особого не имеет, т.к. суть от этого не меняется.
А там, где суть имеет значение, скорее всего, будут использоваться закрытые нейросейти с ручной пост-обработкой, и установить подлинность фотографии без нейросетей следующего поколения будет непросто.

2
Ответить

Если основательно всмотреться, можно много чего найти ).

Ответить