Искусство и наука о генеративном искусственном интеллекте

Возможности нового класса инструментов, в просторечии известного как генеративный искусственный интеллект (ИИ), являются темой многих споров. Одним из известных вариантов применение ИИ является производство высококачественных художественных средств для изобразительного искусства, концепт-арта, музыки и литературы, а также видео и анимации.

Например, диффузионные модели могут синтезировать высококачественные изображения, а большие языковые модели (LLM) могут создавать разумно звучащую и впечатляющую прозу и стихи в широком диапазоне контекстов. Генеративные возможности этих инструментов, вероятно, коренным образом изменят творческие процессы, с помощью которых создатели формулируют идеи и воплощают их в жизнь.

По мере того, как творчество переосмысливается, могут переосмысливаться и многие слои общества. Понимание влияния генеративного ИИ и принятие политических решений на его основе требует новых междисциплинарных научных исследований в области культуры, экономики, права, алгоритмов и взаимодействия технологий и творчества.

На первый взгляд кажется, что генеративные инструменты искусственного интеллекта полностью автоматизируют художественное производство

Впечатление, которое отражает прошлые случаи, когда традиционалисты рассматривали новые технологии как угрозу «самому искусству. На самом деле, эти моменты технологических изменений не указывали на «конец искусства», но имели гораздо более сложные последствия, переделывая роли и практики творцов и меняя эстетику современных медиа. Например, некоторые художники 19-го века рассматривали появление фотографии как угрозу живописи.

Однако вместо того, чтобы заменить живопись, фотография в конечном итоге освободила ее от реализма, породив импрессионизм и движение современного искусства. Напротив, портретная фотография в значительной степени заменила портретную живопись. Точно так же оцифровка музыкального производства (например, цифровой сэмплирование и синтез звука) была осуждена как «конец музыки». Вместо этого он изменил то, как люди производят и слушают музыку, и помог породить новые жанры, включая хип-хоп и драм-н-бэйс.

Как и эти исторические аналоги, генеративный ИИ не является предвестником кончины искусства, а скорее представляет собой новую среду со своими особыми возможностями. Как набор инструментов, используемых создателями-людьми, генеративный ИИ способен перевернуть с ног на голову многие сектора креативной индустрии и за ее пределами, угрожая существующим рабочим местам и трудовым моделям в краткосрочной перспективе, в то же время создавая новые модели творческого труда и реконфигурируя медиа-экосистему.

Однако, в отличие от прошлых сбоев, генеративный ИИ опирается на обучающие данные, сделанные людьми. Модели «учатся» генерировать искусство, извлекая статистические закономерности из существующих художественных средств. Такая зависимость от обучающих данных поднимает новые вопросы, например, откуда берутся данные, как они влияют на выходные данные и как определить авторство.

Используя существующую работу для автоматизации аспектов творческого процесса, генеративный ИИ бросает вызов традиционным определениям авторства, собственности, творческого вдохновения, сэмплирования и ремикса и, таким образом, усложняет существующие концепции медиапроизводства.

Важно учитывать влияние генеративного ИИ на эстетику и культуру, правовые вопросы собственности и кредита, будущее творчества и влияние на современную медиа-экосистему. По всем этим темам есть ключевые исследовательские вопросы, которые должны информировать политику и полезное использование этой технологии.

Чтобы правильно изучить эти темы, сначала необходимо понять, как язык, используемый для описания ИИ, влияет на восприятие технологии. Сам термин «искусственный интеллект» может вводить в заблуждение, подразумевая, что эти системы демонстрируют человеческие намерения, свободу действий или даже самосознание.

Интерфейсы на основе естественного языка теперь сопровождают генеративные модели ИИ, включая интерфейсы чата, в которых используется местоимение «я», что может дать пользователям ощущение человеческого взаимодействия и свободы воли. Такое восприятие может подорвать доверие к создателям, чей труд лежит в основе результатов работы системы, и отвлечь ответственность от разработчиков и лиц, принимающих решения, когда эти системы причиняют вред. Необходима дальнейшая работа, чтобы понять, как восприятие генеративного процесса влияет на отношение к результатам и авторам. Это могло бы облегчить разработку систем, раскрывающих генеративный процесс, и избежать вводящих в заблуждение интерпретаций.

Специфические возможности генеративного ИИ, в свою очередь, порождают новую эстетику, которая может оказать долгосрочное влияние на искусство и культуру. По мере того, как эти инструменты становятся все более распространенными, а их использование становится обычным явлением (как и в случае с фотографией столетие назад), остается открытым вопрос, как эстетика их результатов повлияет на художественные результаты.

Низкий входной барьер для генеративного ИИ может увеличить общее разнообразие художественных результатов за счет расширения круга авторов, занимающихся художественной практикой. В то же время эстетические и культурные нормы и предубеждения, заложенные в обучающих данных, могут быть зафиксированы, отражены и даже усилены, тем самым уменьшая разнообразие. Контент, созданный искусственным интеллектом, также может питать будущие модели, создавая самореферентный эстетический маховик, который может увековечить культурные нормы, основанные на искусственном интеллекте. В будущих исследованиях следует изучить способы количественной оценки и увеличения разнообразия выходных данных, а также изучить, как генеративные инструменты ИИ могут влиять на эстетику и эстетическое разнообразие.

Непрозрачные, максимизирующие вовлеченность рекомендательные алгоритмы платформ социальных сетей могут еще больше укрепить эстетические нормы с помощью циклов обратной связи, которые производят сенсационный и доступный контент

Поскольку создатели алгоритмов и контента пытаются максимизировать вовлеченность, это может еще больше гомогенизировать контент. Тем не менее, некоторые предварительные эксперименты показывают, что включение показателей вовлеченности при курировании контента, созданного ИИ, может в некоторых случаях диверсифицировать контент. Остается открытым вопрос, какие стили усиливаются рекомендательными алгоритмами, и как эта расстановка приоритетов влияет на типы контента, который создатели создают и распространяют. Будущая работа должна исследовать сложные, динамические системы, образованные взаимодействием между генеративными моделями, рекомендательными алгоритмами и платформами социальных сетей, и их результирующее влияние на эстетику и концептуальное разнообразие.

Опора генеративного ИИ на обучающие данные для автоматизации аспектов творчества поднимает юридические и этические проблемы, касающиеся авторства, и, таким образом, должна стимулировать технические исследования природы этих систем. Закон об авторском праве должен уравновешивать выгоды для создателей, пользователей генеративных инструментов ИИ и общества в целом.

Законы могут рассматривать использование обучающих данных как не нарушающее авторские права, если охраняемые произведения не копируются напрямую; добросовестное использование, если обучение включает в себя существенную трансформацию исходных данных; допускается только в том случае, если создатели дают явную лицензию; или при условии обязательного лицензирования, которое позволяет использовать данные для обучения при условии, что создатели получают компенсацию. Большая часть закона об авторском праве опирается на судебные толкования, поэтому пока неясно, будет ли сбор сторонних данных для обучения или имитации стиля художника нарушать авторские права.

Копируют ли модели непосредственно элементы из обучающих данных или создают совершенно новые работы?

Даже в тех случаях, когда модели не копируют непосредственно с существующих работ, неясно, следует ли и как защищать индивидуальные стили художников. Какие механизмы могли бы защитить и компенсировать художников, чьи работы используются для обучения, или даже позволить им отказаться от участия, в то же время позволяя вносить новый культурный вклад с помощью генеративных моделей ИИ? Чтобы ответить на эти вопросы и определить, как закон об авторском праве должен относиться к обучающим данным, требуются значительные технические исследования для разработки и понимания систем ИИ, исследования в области социальных наук для понимания восприятия сходства и юридические исследования для применения существующих прецедентов к новым технологиям. Конечно, эти пункты представляют собой только американскую правовую перспективу.

Отдельный юридический вопрос касается того, кто может претендовать на право собственности на результаты модели. Ответ на этот вопрос требует понимания творческого вклада пользователей системы по сравнению с другими заинтересованными сторонами, такими как разработчики системы и создатели обучающих данных.

Разработчики ИИ могут претендовать на право собственности на выходные данные через условия использования. Напротив, если пользователи системы проявили осмысленный творческий подход (например, процесс не полностью автоматизирован или не имитирует конкретные произведения), то их можно рассматривать как правообладателей по умолчанию. Но насколько существенным должно быть творческое влияние пользователей, чтобы они могли претендовать на право собственности? Эти вопросы связаны с изучением творческого процесса использования инструментов на основе ИИ и могут стать более сложными, если пользователи получат более прямой контроль.

Независимо от юридических последствий, генеративные инструменты ИИ, скорее всего, изменят творческую работу и занятость. Преобладающая экономическая теория [т.е. технологические изменения, ориентированные на навыки (SBTC)] предполагает, что когнитивные и творческие работники сталкиваются с меньшими трудовыми нарушениями из-за автоматизации, потому что творчество не может быть легко включено в конкретные правила (т.е. парадокс Поланьи).

Тем не менее, новые инструменты вызвали проблемы с трудоустройством творческих профессий, таких как композиторы, графические дизайнеры и писатели. Этот конфликт возникает из-за того, что SBTC не может провести различие между когнитивной деятельностью, такой как аналитическая работа и творческие идеи. Необходима новая структура, чтобы охарактеризовать конкретные этапы творческого процесса, на какие из этих этапов могут повлиять генеративные инструменты ИИ, а также влияние на требования и деятельность на рабочем месте различных когнитивных профессий.

Хотя эти инструменты могут угрожать некоторым профессиям, они могут повысить производительность других и, возможно, создать новые. Например, исторически сложилось так, что технологии автоматизации музыки позволяли большему количеству музыкантов творить, даже несмотря на то, что доходы искажались. Генеративные системы искусственного интеллекта могут создавать сотни выходов в минуту, что может ускорить творческий процесс за счет быстрого формирования идей. Однако это ускорение может также подорвать аспекты творчества, устранив начальный период прототипирования, связанный с выражением чистый лист. В любом случае время производства и затраты, скорее всего, упадут. Производство творческих товаров может стать более эффективным, что приведет к тому же объему продукции с меньшим количеством работников.

В свою очередь, спрос на творческие работы может возрасти. Однако производство творческих товаров может стать более эффективным, что приведет к тому же объему продукции с меньшим количеством работников. Кроме того, многие профессии по найму, использующие обычные инструменты, такие как иллюстрации или стоковая фотография, могут быть вытеснены. Несколько исторических примеров подтверждают это. В частности, промышленная революция позволила массовое производство традиционно кустарных ремесел (например, керамики, текстиля и сталелитейного производства) с трудом не ремесленников; Товары ручной работы стали специализацией. Точно так же фотография заменила портретную живопись.

Оцифровка музыки устранила ограничения на обучение физическому манипулированию инструментами и позволила сделать более сложные аранжировки с большим количеством участников. Эти инструменты могут изменить круг лиц, которые могут работать художниками, и в этом случае занятость художников может возрасти, даже если средняя заработная плата упадет.

Поскольку эти инструменты влияют на творческий труд, они также наносят потенциальный вред более широкой медиа-экосистеме. По мере того, как затраты и время на масштабное производство медиа уменьшаются, медиаэкосистема может стать уязвимой для дезинформации, генерируемой ИИ, за счет создания синтетических медиа, особенно медиа, которые предоставляют доказательные доказательства для претензий. Эти новые возможности для создания фотореалистичных синтетических медиа могут подорвать доверие к достоверно захваченным медиа за счет так называемого «дивиденда лжеца» (фальшивый контент приносит пользу лжецам, подрывая доверие к правде) , а также увеличить угрозы мошенничества и сексуальных изображений без согласия.

Какова роль вмешательств платформы, таких как отслеживание происхождения источника и обнаружение синтетических медиа в управлении и укреплении доверия? И как распространение синтетических СМИ влияет на доверие к реальным СМИ, таким как неотредактированные журналистские фотографии?

По мере увеличения производства контента продолжительность коллективного внимания может уменьшаться. Взрывной рост контента, генерируемого искусственным интеллектом, может, в свою очередь, помешать обществу коллективно обсуждать и действовать в таких важных областях, как климат и демократия.

Каждая художественная среда отражает и комментирует проблемы своего времени, а дебаты вокруг современного искусства, созданного искусственным интеллектом, отражают текущие проблемы, связанные с автоматизацией, корпоративным контролем и экономикой внимания. В конечном счете, мы выражаем нашу человечность через искусство, поэтому понимание и формирование влияния ИИ на творческое самовыражение находится в центре более широких вопросов о его влиянии на общество. Новые исследования в области генеративного ИИ должны информировать политику и полезное использование технологии при взаимодействии с важнейшими заинтересованными сторонами, особенно с самими художниками и творческими работниками, многие из которых активно занимаются сложными вопросами в авангарде социальных изменений.

PS. лайк, пожалуйста, он помогает продвижению статьи.

Ну и как положено на VC, канал телеграм))) Канал и чатик

Туда выкладываю статьи VC и то, что нет в VC. Мысли, идеи, опыт.

В закрепленных канале всегда telegram боты Kolersky для доступа вChatGPT, GPT-4 без VPN, а так же генераторы изображений Midjourney, Dall-e, Stable Diffusion+ (все проекты: KolerskyAI).

6 комментариев

Брянский Бренд

08.07.2023

люблю такого рода статьи ,когда автор понимает что ИИ это не зло ,а наоборот вариант развития и улучшения

Ответить

Дима Котов

иногда такие варианты развития как раз являются злом

Жанна Синотова

если мыслить шире ,что собственно указывается в статье ,то все взаимодополняемо и может быть результативным

О. Чайкина

"Дева" на картинке нуждается в спасении! Создание с открытой внутрянкой заставляет её ("деву") съесть что-то явно ужасное (о чём говорят напряжённая поза и закрытые глаза), да ещё и злорадно ухмыляется.

Искусство и наука о генеративном искусственном интеллекте

Переплетаются юридические и технические вопросы:

В связи с этим возникают важные исследовательские вопросы: