Около 20 миллионов чатов пользователей ChatGPT вот-вот будут обнародованы из-за судебного иска

Почти 20 млн пользовательских диалогов с ChatGPT могут оказаться под угрозой раскрытия из-за продолжающейся судебной тяжбы компании OpenAI с New York Times. Суд США постановил, что эти анонимизированные логи являются допустимым материалом для исследования в рамках иска о предполагаемом нарушении авторских прав, и OpenAI теперь пытается оспорить это решение, апеллируя к защите конфиденциальности пользователей.

Около 20 миллионов чатов пользователей ChatGPT вот-вот будут обнародованы из-за судебного иска

Иск New York Times был подан в конце 2023 года. Газета утверждает, что модели OpenAI создают тексты, близкие к материалам NYT, а значит, компания использовала их публикации для обучения без разрешения и нарушила авторские права. OpenAI обвинения отвергает, настаивая, что модели обучались на общедоступных данных, а случаи точных совпадений — крайне редкие и не свидетельствуют о систематическом копировании. Для проверки этих утверждений NYT запросила доступ к пользовательским перепискам: изначально речь шла о 1,4 млрд чатов за двухлетний период, позже запрос был уменьшён до случайной выборки из 20 млн диалогов.

Суд, рассматривая вопрос о допустимости раскрытия, сослался на то, что деидентификация чувствительных данных уже встроена в процессы OpenAI и в достаточной степени защищает конфиденциальность. OpenAI же утверждает, что 99,99% этих разговоров не имеют никакого отношения к предмету спора, и потому запрос носит характер «спекулятивной пробы» — попытки найти что-то, что может поддержать обвинения, не имея предварительных оснований.

В публичном письме в суд компания настаивает на отмене решения и параллельно опубликовала блог-пояснение, в котором назвала иск NYT необоснованным и угрозой пользовательской приватности. В компании подчёркивают, что даже анонимизированные переписки могут содержать фрагменты личной информации, случайно включённой пользователями в свои запросы, и что принуждение к раскрытию таких массивов создаёт нежелательный прецедент для всей отрасли.

Тем не менее текущее решение суда выглядит однозначным: предоставление логов рассматривается как допустимый элемент расследования. Если апелляция OpenAI не будет удовлетворена, анонимизированные чаты действительно окажутся у стороны обвинения — и это неизбежно усилит дискуссию о том, как следует защищать конфиденциальные данные, передаваемые пользователями в ИИ-системы.

Пока вопрос остаётся юридическим, но его последствия могут стать технологическими и общественными: «конфиденциальность общения с ИИ» впервые превращается в реальную правовую тему, а не абстрактное предупреждение в пользовательском соглашении.

А вы пишете в ChatGPT какую-то личную информацию, раскрывать которую нежелательно?

3 комментария