Reddit сделает доступ к своему API платным — из-за компаний, которые обучают нейросети на разговорах в соцсети

Доступ оставят бесплатным для исследователей и тех, кто делает «полезные для соцсети» приложения на основе API.

  • Reddit собирается начать взимать плату с компаний за доступ к своему API — он позволяет в том числе выгружать истории сообщений пользователей в каждом сабреддите, пишет The New York Times. Когда именно это произойдёт — пока неизвестно. Reddit ещё уточняет детали платного доступа и объявит цены «в ближайшие недели».
  • Брать деньги будут не со всех: API останется бесплатным для разработчиков, которые используют его для создания приложений, «помогающих людям использовать Reddit» — например, ботов, которые отслеживают, соответствуют ли комментарии правилам сабреддита. Также использовать API бесплатно смогут исследователи, которым данные нужны для некоммерческих целей. Но разработчикам ИИ придётся платить.
  • Как отмечает издание, крупные компании вроде Google, OpenAI и Microsoft уже несколько лет используют разговоры пользователей в Reddit для обучения своих нейросетей. Например, на них частично обучен Bard от Google, а ChatGPT от OpenAI ссылается на соцсеть как на один из источников данных для обучения.
  • Среди других таких крупных источников информации, необходимой для обучения, — «Википедия» и оцифрованные книги. Но Reddit считает свои данные «особенно ценными», потому что они постоянно обновляются — и именно эта «новизна» нужна необходима нейросетям.
  • При этом сооснователь соцсети Стив Хаффман отмечает, что Reddit — это «место общения», и пользователи часто делятся в интернете тем, что «могли бы рассказать только на сеансе терапии или вообще никогда». Поэтому он считает «справедливым», если компании будут платить за доступ к этим данным. Будет ли соцсеть платить из этих денег что-то пользователям — не уточняется.
  • В феврале 2023 года о планах отключить бесплатный доступ к своему API сообщил Twitter. Хотя соцсеть официально не объявляла причину, NYT предполагает, что причина та же, что и у Reddit: с помощью API можно отслеживать разговоры пользователей и затем использовать для обучения нейросетей.
  • В апреле владелец Twitter Илон Маск рассказал, что работает над альтернативой чат-бота ChatGPT под названием TruthGPT. Тренировать языковые модели он может в том числе на контенте из Twitter, отмечали источники.
  • В 2021 году сотрудничать друг с другом начали Shutterstock и OpenAI: фотобанк продавал разработчику изображения и метаданные, чтобы тот мог совершенствовать нейросеть DALL-E. В октябре 2022-го Shutterstock объявил, что разрешит владельцам платной подписки генерировать изображения с помощью DALL-E 2. А авторам, чьи работы используются для её обучения, пообещал выплаты.
2626
55 комментариев

Нейросетка после 5-и лет обучения на комментариях VC: "Тёма Лебедев что ли делал? Не взлетит, говно. А ты прям диванный эксперт? Как я заработал миллиард за неделю. Подписывайтесь на мой телеграм-канал."

62

Комментарий недоступен

16

return "<a href='linktosomerouteatwww'>Платный курс как стать миллиардером вот прям сразу</a>"

3

Если еще научится мемы вставлять где нужно, то цены не будет этой нейросети

3

"А что случилось?" ещё.

- Пользователи делятся самым сокровенным, собирать такие данные неправильно. Но если за деньги, то можно. Вот номер счета хххх хххх хххх хххх…

12