Reddit сделает доступ к своему API платным — из-за компаний, которые обучают нейросети на разговорах в соцсети Статьи редакции

Доступ оставят бесплатным для исследователей и тех, кто делает «полезные для соцсети» приложения на основе API.

  • Reddit собирается начать взимать плату с компаний за доступ к своему API — он позволяет в том числе выгружать истории сообщений пользователей в каждом сабреддите, пишет The New York Times. Когда именно это произойдёт — пока неизвестно. Reddit ещё уточняет детали платного доступа и объявит цены «в ближайшие недели».
  • Брать деньги будут не со всех: API останется бесплатным для разработчиков, которые используют его для создания приложений, «помогающих людям использовать Reddit» — например, ботов, которые отслеживают, соответствуют ли комментарии правилам сабреддита. Также использовать API бесплатно смогут исследователи, которым данные нужны для некоммерческих целей. Но разработчикам ИИ придётся платить.
  • Как отмечает издание, крупные компании вроде Google, OpenAI и Microsoft уже несколько лет используют разговоры пользователей в Reddit для обучения своих нейросетей. Например, на них частично обучен Bard от Google, а ChatGPT от OpenAI ссылается на соцсеть как на один из источников данных для обучения.
  • Среди других таких крупных источников информации, необходимой для обучения, — «Википедия» и оцифрованные книги. Но Reddit считает свои данные «особенно ценными», потому что они постоянно обновляются — и именно эта «новизна» нужна необходима нейросетям.
  • При этом сооснователь соцсети Стив Хаффман отмечает, что Reddit — это «место общения», и пользователи часто делятся в интернете тем, что «могли бы рассказать только на сеансе терапии или вообще никогда». Поэтому он считает «справедливым», если компании будут платить за доступ к этим данным. Будет ли соцсеть платить из этих денег что-то пользователям — не уточняется.
  • В феврале 2023 года о планах отключить бесплатный доступ к своему API сообщил Twitter. Хотя соцсеть официально не объявляла причину, NYT предполагает, что причина та же, что и у Reddit: с помощью API можно отслеживать разговоры пользователей и затем использовать для обучения нейросетей.
  • В апреле владелец Twitter Илон Маск рассказал, что работает над альтернативой чат-бота ChatGPT под названием TruthGPT. Тренировать языковые модели он может в том числе на контенте из Twitter, отмечали источники.
  • В 2021 году сотрудничать друг с другом начали Shutterstock и OpenAI: фотобанк продавал разработчику изображения и метаданные, чтобы тот мог совершенствовать нейросеть DALL-E. В октябре 2022-го Shutterstock объявил, что разрешит владельцам платной подписки генерировать изображения с помощью DALL-E 2. А авторам, чьи работы используются для её обучения, пообещал выплаты.
Популярная, но недооценённая: что может сделать Reddit, чтобы зарабатывать ещё больше Статьи редакции

По количеству и приросту пользователей Reddit обгоняет Twitter, но получает от аудитории в десятки раз меньше выручки. The Generalist предлагает несколько идей, как это исправить: например, пересмотреть дизайн, алгоритмы и поддержать активных авторов.

Фото: Тиффани Хаглер-Герд, Bloomberg
0
55 комментариев
Написать комментарий...
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
52 комментария
Раскрывать всегда