Reddit подала иск к Perplexity и ещё трём компаниям из-за обучения ИИ-моделей на публикациях пользователей
ИИ-поисковик в ответ обвинил компанию в «вымогательстве».
- Соцсеть подала иск к разработчику ИИ-поисковика Perplexity, а также сервисам сбора данных: литовской Oxylabs, российской AWMProxy и техасской SerpApi, обвинив их в незаконном сборе информации для обучения ИИ-моделей, пишут Reuters и CNBC.
- По словам Reddit, Oxylabs, AWMProxy и SerpApi смогли «вытащить» контент, выдав своих скраперов — ботов для извлечения данных с сайтов — за обычных пользователей.
- К Perplexity другие претензии — якобы ИИ-поисковик собирал информацию без лицензионного соглашения с соцсетью, а также сотрудничал со сторонней компанией, которая помогала ему извлекать данные.
- Reddit требует выплатить ей компенсацию, размер которой не указан, а также запретить Perplexity использовать данные в соцсети.
- Perplexity назвал иск «вымогательством», SerpApi заявила, что не согласна с обвинениями, в Oxylabs сообщили, что «шокированы», а в AWMProxy не ответили на запрос о комментарии.
- Аналогичный иск в июне 2025 года Reddit подала к Anthropic за обучение ИИ-моделей на данных соцсети без лицензионного соглашения.
В апреле 2023 года Reddit объявила, что начнёт взимать плату с компаний за доступ к своему API и сделает исключение только для исследователей некоммерческих проектов и разработчиков, которые на его основе создают сервисы, упрощающие использование Reddit, — вроде ботов для модерации контента. Компания решила сделать это из-за компаний, которые обучают нейросети на разговорах в соцсети.
В августе 2024 года компания начала блокировать доступ к сайту поисковикам и ботам компаний, что не заключили с соцсетью соглашения об использовании её данных — в том числе для обучения ИИ.
После этого пользователи заметили, что результаты с Reddit появляются только в поисковой выдаче Google — та как раз платит соцсети за доступ к данным и право обучать на них нейросети. Такой же договор заключили и с OpenAI.
Сооснователь и глава Reddit Стив Хаффман тогда отмечал, что доступ был бесплатным, так как из поисковиков пользователи переходили на сайт соцсети, но теперь речь идёт об обучении ИИ на этих данных, перепродаже и выжимке информации в своих целях.