OpenAI: данные, защищенные авторским правом, "невозможно" избежать для обучения ИИ

Статья является переводом с сайта

На этой неделе OpenAI наделала много шума своим смелым заявлением в парламентском комитете Великобритании о том, что без использования огромного количества данных, защищенных авторским правом, разработать ведущие современные системы ИИ будет "невозможно".

Компания утверждала, что передовые инструменты ИИ, такие как ChatGPT, требуют настолько широкого обучения, что соблюдение закона об авторском праве было бы совершенно нецелесообразным.

В письменных показаниях OpenAI заявила, что благодаря расширенным законам об авторском праве и повсеместному распространению защищенного онлайн-контента, "практически все виды человеческих высказываний" окажутся вне зоны доступа для обучающих данных. От новостных статей до комментариев на форумах и цифровых изображений - мало какой онлайн-контент может быть использован свободно и легально.

По мнению OpenAI, попытки создать эффективный ИИ, избегая при этом нарушения авторских прав, потерпят неудачу: "Ограничение обучающих данных книгами и рисунками, находящимися в общественном достоянии и созданными более века назад... не позволит создать системы ИИ, отвечающие потребностям современных граждан".

Защищая свою практику как соответствующую нормам, OpenAI признала, что партнерство и компенсационные схемы с издателями могут быть оправданы для "поддержки и расширения возможностей авторов". Однако компания не дала понять, что намерена резко ограничить сбор онлайн-данных, в том числе платной журналистики и литературы.

Такая позиция открыла OpenAI путь к многочисленным судебным искам, в том числе от таких СМИ, как The New York Times, обвиняющих ее в нарушении авторских прав.

Тем не менее, OpenAI, похоже, не желает кардинально менять процессы сбора данных и обучения, учитывая "невозможные" ограничения, которые наложит на себя авторское право. Вместо этого компания надеется опираться на широкое толкование принципов добросовестного использования, чтобы легально использовать огромные массивы данных, защищенных авторским правом.

Поскольку передовой ИИ продолжает демонстрировать удивительные способности к подражанию человеческому самовыражению, эксперты в области права ожидают активных судебных баталий по поводу нарушения авторских прав системами, изначально предназначенными для поглощения огромных объемов защищенных текстов, медиа и других творческих материалов.

Пока что OpenAI делает ставку на максимализм в области авторского права в пользу почти безграничного копирования, чтобы стимулировать дальнейшее развитие ИИ.

Бесплатный ChatGPT бот