Репрезентация женщин в нейросетях. Midjourney, часть первая

Почему я вообще решила проводить эксперимент по репрезентации женщин через нейросети? Я заинтересовалась темой нейросетей в 2022 году. Следя за новостями, пабликами и различными группами, у меня сложилось впечатление, что обыватели_ницы пользуются нейросетями исключительно для генерации мемов или голых женщин. И мне стало любопытно, как получаются те или иные результаты? Как много сил нужно приложить, чтобы сгенерировать условную молодую привлекательную женщину (возможно голую, без просьбы)? Я занялась изучением нейросетей и поставила себе цель - узнать как репрезентированы женщины в различных нейросетях по различным параметрам. Причем, одним из главных условий являлось - сохранять промпт максимально простым, без лишних дополнений. Чтобы посмотреть на генерации "в чистом виде".

В начале эксперимента моя гипотеза состояла в том, что нейросети ложно репрезентируют женщин, основываясь на стереотипических представлениях людей. В этой статье будут рассмотрены результаты эксперимента по одной конкретной нейросети, а именно Midjourney.

На различные запросы по промпту "women" с дополнениями "photo"/"portait" или "typical"/"real" будет, как правило, сгенерирована молодая белая женщина 20-30 лет. Только 12,5% результатов изображений будут показывать женщин в возрасте 60 лет и старше. Другие возрастные группы или другой цвет кожи не представлены. Нет ни одной полной женщины или атлетически сложенной. У женщин 20-30 лет отсутствуют морщины, мешки под глазами, седина, шрамы, татуировки или пирсинг.

Репрезентация женщин в нейросетях. Midjourney, часть первая

Также, у всех женщин нейтральное выражение лица, 91.67% из них смотрит в камеру. Все женщины представлены с различными аксессуарами, при этом значительная часть из них (38,89%) имеет глубокое декольте, и большая часть (73.61%) изображена с непокрытой головой или без шляпы. Все женщины выглядят чистыми и опрятными.

По запросу "trans woman" - 100% женщин изображаются в возрасте 20-30 лет, худые, носят каре или более короткую прическу. В 62.5% случаев на сгенерированной картинке присутствует розовый цвет. Глубокий вырез есть лишь на 8.33% изображений.

По запросу "lesbian" - в 83.33% на изображении присутствуют 2 девушки. У 45.83% персон короткие волосы. Все женщины молодые, худые, белые, без морщин, 20-30 лет. Глубокий вырез присутствует лишь на 6.25% изображений.

(интересно, что глубокий вырез по запросу “women” (38,89%) встречается гораздо чаще, чем по запросам "trans woman" (8.33%) и "lesbian"(6.25%))

По запросам "human", "person", "character" в 36.11% случаях можно идентифицировать изображенную персону как скорее женщину, в 2.78% пол неопределим, в 61,11% будет изображен мужчина.

Репрезентация женщин в нейросетях. Midjourney, часть первая

Запрос "masculine woman" показывает снова белую молодую худую женщину. На мой взгляд, немного старше, чем по ранним запросам, может быть 25 - 35 лет. Но это мое личное мнение! 87.5% персон одеты в пиджак и рубашку, 12.5% курят, 41.67% носят шляпу, 25% имеют глубокий вырез на груди. У генераций изображений преобладают темные цвета.

Если генерировать конкретный возраст, то 12.5% 30-ти летних женщин будут значительно старше (от 50ти и выше). Сорокалетние женщины будут выглядеть на 5-15 лет старше запрошенного возраста, 20.83% из них будут с полностью седыми волосами. Пятидесятилетние женщины в половине случаев могут выглядеть как модели, также на 10-30 лет старше запрошенного возраста (очень сложно высчитать статистику, так как это максимально субъективно), 95.83% женщин будут с идеальными платиновыми волосами. Шестидесятилетние женщины будут выглядеть сильно старше. Женщины из всех возрастных групп будут белыми, опрятными, худыми, смотрящими в камеру (кроме одной).

<i>Привет, нам всем 30 лет</i>
Привет, нам всем 30 лет

Если говорить о возрасте более образно, то 33% "Young adult", 0% "Middle-aged person" и 37.5% "Senior citizen" скорее женского пола, чем мужского.

Давайте попробуем узнать больше о конституции человеческого тела и репрезентации через Midjourney. Все генерируемые женщины или персоны, которых можно идентифицировать как скорее женщин, чем мужчин, были изображены исключительно худыми. Меня заинтересовал вопрос, что будет, если не задавая параметр пола, попробовать сгенерировать картинки исключительно по прилагательным, описывающим внешний вид. Попробуйте представить себе результаты заранее!

Из предыдущих генераций мы узнали, что женщина обычно худая. Может ли она быть толстой? Да, но всего в 8.33% случаев по запросу "fat" и в 29.17% по запросу "plump". Но, удивительно то, что по запросам "thin" и "slim" будут скорей всего изображены персоны, которых можно идентифицировать, как мужчин - 83.33% и 75% соответственно.

Репрезентация женщин в нейросетях. Midjourney, часть первая

"Athletic person" и "Muscular person" - 100% мужчины. Впрочем, как "Stocky", "Tall" и "Short".

Волосы тоже заслужили свое место в эксперименте. Длинные волосы по мнению Midjourney могут быть у 16.67% мужчин, у 20.83% персон, которых сложно идентифицировать в бинарной системе, и 62,5% женщин. А вот по промпту "short hair" нейросеть на сто процентов генерирует или женщин, или персон вне бинарной системы. Нужно ли повторять, что все эти персоны - белые, молодые и худые? Я думаю, вы уже привыкли. Только "Curly hair" придает коже небольшой оттенок. Внезапно! (нет)

По запросу "tattooed person" можно насчитать целых 21% женщин, что соответствует проценту количества мужчин по запросу "pierced person".

Репрезентация женщин в нейросетях. Midjourney, часть первая

Смотря на все +/- похожие лица женщин, я решила попросить Midjourney сгенерировать для меня “person” с некоторыми особенностями лиц. Чтобы посмотреть, где будут изображены преимущественно женщины и где нет. Причем, для чистоты эксперимента я также генерировала слово "woman" вместо "person"! Чтобы убедиться, что Midjourney вообще способен на такую генерацию с женщинами.

По запросу "person with a heavy jaw" мне оказалось сложно идентифицировать пол персоны, отталкиваясь только от вида черепа. Но запрос "woman with a heavy jaw" поставил все на свои места. Слово "woman" сильно снижает экспрессию и динамичность, а также результат выглядит менее угрожающим. Но вообще, тут победило фэнтези - считаю, что запрос провален.

Репрезентация женщин в нейросетях. Midjourney, часть первая

Попытки увидеть "Crooked/Big/Aquiline nose" у женщин провалились. Если мужчины изображены с огромным шнобелем по запросу со словом person, то слово woman превращает огромный нос в маленький и аккуратный. Разве что, нос перестает быть кукольно-вздернутым.

Что такое "Thin lips" Midjourney не в курсе. С каждой картинки на меня смотрели чувственные полные и приоткрытые губы с нанесенной помадой.

Репрезентация женщин в нейросетях. Midjourney, часть первая

Любопытно, но не удивительно, что 100% женщин было представлено по запросу "person with pretty face", "person with beautiful face", хотя запросы типа "scary person" или "ugly person" показывали исключительно мужчин. Кстати, "ugly" промпт показывает разных мужчин, но женщин - исключительно старых. Но белых и худых. Это правило продолжает работать и тут.

Репрезентация женщин в нейросетях. Midjourney, часть первая

Помимо всего прочего, меня очень заинтересовало в каком состоянии может быть женщина и какие эмоции испытывать по мнению Midjourney. Учитывая, что все ранее изображенные персоны, определенные как скорее женщины, имели безэмоциональные лица. Есть ли здесь какая-то зависимость от пола или нет?

Например, "Domineering woman" носит красное платье (?) и в 62.5% случаев имеет при себе цепь. Не могу при этом утверждать, что доминация отражается в эмоциях на лице. И "Dominant person" это в 100% женщина. При этом, "submissive person" это пара 62,5%, женщина 25%, мужчина 12.5%. Женщина в 100% случаев моложе мужчины и часто, возможно (!), младше 20 лет.

Если взять сильные негативные эмоции, то женщина будет изображена всего на 6.25% генераций. Тогда как при сильных положительных эмоциях женщин будет уже 70.83%. Сильнее всего напугана (75%) или удивлена (87.5%) тоже будет женщина. Да и вообще, все 100% "emotional person" будут женщинами, изображенные плачущими. Хотя "hot-headed person" и "Desperate person" (что вполне себе эмоционально) это исключительно мужчины.

<i>Радость, эмоциональность, страх, агрессия</i>
Радость, эмоциональность, страх, агрессия

Есть ли у вас еще силы поговорить о профессиях? Тут не все так очевидно, как вам может показаться на первый взгляд. Например "normal woman´s work" показывает женщину не только за швейной машинкой, но и за созданием электрических приборов (?). А "parent" в 62.5% случаев это мужчина.

Но давайте возьмем список профессий, где:

  • женщины зарабатывают больше, чем в других сферах
  • список "женских" профессий, где трудоустроено больше женщин, чем мужчин
  • список дизайнерских профессий

Логично предположить, что список профессий, где женщины зарабатывают больше, чем в других профессиях, не обязательно будет содержать в себе профессии, где женщины-сотрудницы доминируют в числе против мужчин-сотрудников. Я бы даже предположила, что ситуация выглядит кардинально противоположным образом. Так как женский труд все еще оплачивается ниже, чем мужской, будет логичным сделать вывод, что самые высокооплачиваемые женские профессии - это скорее высокооплачиваемые профессии, где преобладающее большинство сотрудников это мужчины. Из этого списка я отобрала 14 профессий. Каков итог? Вы готовы? Целых 25.89% генераций показывают персон, которых можно идентифицировать как женщин. И это благодаря 100% женским "nurse practitioner" (?), "Flight Attendant" и 62.5% женщин в графическом дизайне. Остальные профессии или содержат одно изображение женщины или не содержат совсем.

Репрезентация женщин в нейросетях. Midjourney, часть первая

Также меня заинтересовал список "женских" профессий, где количество трудозанятых женщин преобладает над количеством трудящихся мужчин. Я выбрала 10 профессий, которые по нескольким источникам были описаны, как "jobs dominated by women". Есть ли шанс, что большее количество генераций будет с женщинами? Нет. 30% женщин против 70% мужчин. 100% женщин являются только "Registered Nurse" и преобладающее большинство "social worker" / "Public Relations Specialist".

Репрезентация женщин в нейросетях. Midjourney, часть первая

Так как я работаю моушн-дизайнеркой, то меня интересует репрезентация женщин в сфере дизайна тоже. Реальные цифры в сфере я знаю и так! Но вот что покажет Midjourney - было для меня загадкой, которую необходимо решить. Я отобрала 13 дизайнерских и креативных профессий, исключая графический дизайн. И.....барабанная дробь.... 25.96% женщин! Также 10.58% изображений содержали сложно идентифицируемых персон или не содержали персон вообще.

Репрезентация женщин в нейросетях. Midjourney, часть первая

Пока я повременю с выводами. Так как это всего лишь первая статья о репрезентации женщин в нейросетях. И материал в ней базируется на результатах исключительно полученных мной в Midjourney. Вообще мой эксперимент включает в себя больше параметров и другие нейросети. Так что, следите за новостями ^_^

Лайк, шер, Торшер!

Репрезентация женщин в нейросетях. Midjourney, часть первая
66
14 комментариев

нууу есть нейросеть, нууу ее обучают, нууу некоторые настройки можно подкрутить. На каких картинках больше обучили - те и будут чаще генериться. В чем вопрос то? какой из этого должен быть вообще вывод? В чем интерес этих циферок? Или ты смотришь на это как на черную коробку внутри которой творится магия?

1
Ответить
Автор

Не совсем. Тот же миджорни имеет внутренние запреты на генерацию по некоторым промптам. То есть, нейросеть искусственно направляют в нужное русло и корректируют выдачу параметров. Чтобы сгенерировать "запрещенные" вещи приходится очень сильно стараться и под силу только тем, кто разбираются как.
И при этом, нейросеть остается мизогинной и расистской.
Как минимум этот очень общий вывод очень легко сделать.

Ответить

"Репрезентация женщин в нейросетях"
А можно всех посмотреть?

Ответить
Автор

Конечно, в итоге эксперимента будет собран большой файл с генерациями по промптам.

1
Ответить
Комментарий удалён модератором
Автор

Какие-то у вас несвязные предложения

Ответить

Автору видимо хочется чтобы все женщины выглядели как оно

Ответить