Reddit сделает доступ к своему API платным — из-за компаний, которые обучают нейросети на разговорах в соцсети Статьи редакции
Доступ оставят бесплатным для исследователей и тех, кто делает «полезные для соцсети» приложения на основе API.
- Reddit собирается начать взимать плату с компаний за доступ к своему API — он позволяет в том числе выгружать истории сообщений пользователей в каждом сабреддите, пишет The New York Times. Когда именно это произойдёт — пока неизвестно. Reddit ещё уточняет детали платного доступа и объявит цены «в ближайшие недели».
- Брать деньги будут не со всех: API останется бесплатным для разработчиков, которые используют его для создания приложений, «помогающих людям использовать Reddit» — например, ботов, которые отслеживают, соответствуют ли комментарии правилам сабреддита. Также использовать API бесплатно смогут исследователи, которым данные нужны для некоммерческих целей. Но разработчикам ИИ придётся платить.
- Как отмечает издание, крупные компании вроде Google, OpenAI и Microsoft уже несколько лет используют разговоры пользователей в Reddit для обучения своих нейросетей. Например, на них частично обучен Bard от Google, а ChatGPT от OpenAI ссылается на соцсеть как на один из источников данных для обучения.
- Среди других таких крупных источников информации, необходимой для обучения, — «Википедия» и оцифрованные книги. Но Reddit считает свои данные «особенно ценными», потому что они постоянно обновляются — и именно эта «новизна» нужна необходима нейросетям.
- При этом сооснователь соцсети Стив Хаффман отмечает, что Reddit — это «место общения», и пользователи часто делятся в интернете тем, что «могли бы рассказать только на сеансе терапии или вообще никогда». Поэтому он считает «справедливым», если компании будут платить за доступ к этим данным. Будет ли соцсеть платить из этих денег что-то пользователям — не уточняется.
- В феврале 2023 года о планах отключить бесплатный доступ к своему API сообщил Twitter. Хотя соцсеть официально не объявляла причину, NYT предполагает, что причина та же, что и у Reddit: с помощью API можно отслеживать разговоры пользователей и затем использовать для обучения нейросетей.
- В апреле владелец Twitter Илон Маск рассказал, что работает над альтернативой чат-бота ChatGPT под названием TruthGPT. Тренировать языковые модели он может в том числе на контенте из Twitter, отмечали источники.
- В 2021 году сотрудничать друг с другом начали Shutterstock и OpenAI: фотобанк продавал разработчику изображения и метаданные, чтобы тот мог совершенствовать нейросеть DALL-E. В октябре 2022-го Shutterstock объявил, что разрешит владельцам платной подписки генерировать изображения с помощью DALL-E 2. А авторам, чьи работы используются для её обучения, пообещал выплаты.
28K
показов
9.5K
открытий
1
репост
Нейросетка после 5-и лет обучения на комментариях VC: "Тёма Лебедев что ли делал? Не взлетит, говно. А ты прям диванный эксперт? Как я заработал миллиард за неделю. Подписывайтесь на мой телеграм-канал."
Комментарий недоступен
return "<a href='linktosomerouteatwww'>Платный курс как стать миллиардером вот прям сразу</a>"
Если еще научится мемы вставлять где нужно, то цены не будет этой нейросети
"А что случилось?" ещё.
- Пользователи делятся самым сокровенным, собирать такие данные неправильно. Но если за деньги, то можно. Вот номер счета хххх хххх хххх хххх…
И это хорошо.
Гиганты заплатят и все может выйти в не очень хорошую историю, но по началу это будет не так очевидно, поймут все, но только тогда, когда будет слишком поздно. Сейчас это звучит смешно.
Комментарий недоступен
Я думаю крупные компании этим не страдают
Комментарий недоступен
Соевики с реддита.
Аря! Плохо комменты людей брать!
А за деньги пожалуйста.
Л - лицемерие.
Так они говорят только про коммерческое использование
Комментарий недоступен
я думаю сделали правильно
Собака на сене?
Комментарий недоступен
Диалоги отпад там были 7 лет назад, сейчас это помойка. Говорю как автор ответов с количеством просмотров 1млн+
Комментарий недоступен
Комментарий недоступен
Будут парсить. Только нагрузка увеличится
[email protected]
Тренировать языковые модели он может в том числе на контенте из Twitter, отмечали источники.
какие то не особо хорошие тренировки у них получатся😂
Брать деньги будут не со всех
Что это за несправедливость то
С учётом парсинга, пусть вообще доступ сделают платный. Или закроются! Слишком ценные данные.
Ну так кое-кто так и сделал. Попробуй попарси Discord
Справедливо. Забавно что таким способом ценность всех соцсетей автоматически выросла.
еще бы топам платили
Комментарий недоступен
Комментарий недоступен
Дохуя возомнил о себе этот Реддит.
Да, твари, не хотят просто так обучать нейросети :)
навряд ли сеть будет что то платить из этих денег пользователям
return "Платный курс как стать миллиардером вот прям сразу"
Диалоги отпад там были 7 лет назад, сейчас это помойка. Говорю как автор ответов с количеством просмотров 1млн+
Слишком много народу, ботов и спама?
С этими чатботами возникнет такая проблема (не только у редит, а вообще). Чатботы будут брать инфу с вебсайтов и на основании нее генерить свои ответы. Пользователю уже не надо будет заходить на сайты, чтобы получить соответствующую информацию. И возникает вопрос: а владельцам сайтов-то зачем это надо? Создавать сайты, наполнять их, платить за хостинг и т.д...
Соевики с реддита.
Аря! Плохо комменты людей брать!
А за деньги пожалуйста.
Л - лицемерие.
Справедливо. Забавно что таким способом ценность всех соцсетей автоматически выросла.
Если еще научится мемы вставлять где нужно, то цены не будет этой нейросети
А что мешает спарсить?