Reddit подала иск к Anthropic за обучение ИИ-моделей на данных соцсети без лицензионного соглашения
Компания требует соблюдать её правила и возместить ущерб.
- Reddit обвиняет Anthropic в «незаконном» использовании её собственных данных, пишут TechCrunch и CNBC. По заявлению компании, ИИ-стартап нарушил пользовательское соглашение соцсети, которое запрещает бесплатное обучение ИИ-моделей на разговорах в Reddit.
- Reddit утверждает, что Anthropic обучал модели на основе персональных данных пользователей Reddit без их согласия. А в результате таких действий компании был нанесён «ущерб» — какой именно и в каком размере, не уточняется.
Anthropic не заботится ни о правилах Reddit, ни о пользователях: он считает, что может брать любой контент, какой захочет, и безнаказанно использовать его по своему усмотрению.
- Другие же компании «понимают и уважают» правила соцсети: в пример она привела Google и OpenAI — им разрешено использовать общедоступный контент на Reddit по условиям лицензии.
- Anthropic в ответ на обвинения заявил, что не согласен с заявлениями Reddit и будет «отстаивать свою позицию».
В апреле 2023 года Reddit объявила, что начнёт взимать плату с компаний за доступ к своему API и сделает исключение только для исследователей некоммерческих проектов и разработчиков, которые на его основе создают сервисы, упрощающие использование Reddit, — вроде ботов для модерации контента. Компания решила сделать это из-за компаний, которые обучают нейросети на разговорах в соцсети.
В августе 2024 года компания начала блокировать доступ к сайту поисковикам и ботам компаний, что не заключили с соцсетью соглашения об использовании её данных — в том числе для обучения ИИ.
После этого пользователи заметили, что результаты с Reddit появляются только в поисковой выдаче Google — та как раз платит соцсети за доступ к данным и право обучать на них нейросети. Такой же договор заключили и с OpenAI.
Сооснователь и глава Reddit Стив Хаффман тогда отмечал, что доступ был бесплатным, так как из поисковиков пользователи переходили на сайт соцсети, но теперь речь идёт об обучении ИИ на этих данных, перепродаже и выжимке информации в своих целях.