Как лояльное на протяжении 20 лет сообщество может взбунтоваться — на примере Audacity и сбора данных Статьи редакции

Команда хотела получить немного аналитики для развития проекта и подстроиться под юридические реалии 2021 года. Но не обсудила перемены с пользователями.

Команда свободного аудиоредактора Audacity дважды столкнулась с критикой со стороны пользователей, после того как проект купила Muse Group в конце апреля 2021 года. Причиной стали изменения в политике работы с данными.

Muse Group — компания, созданная на базе музыкального сообщества Ultimate Guitar, которое основал Евгений Найдёнов в 1998 году. Помимо Ultimate Guitar и Audacity в группу входят нотный редактор MuseScore, мобильный эмулятор гитарного звука Tonebridge и другие проекты.

Audacity — приложение с открытым кодом, которое больше 20 лет было бесплатным и не собирало данные пользователей. У него 100 млн пользователей по всему миру.

Разработчики вызвали гнев сообщества, когда сначала объявили о планах собирать данные для аналитики через инструменты Google и «Яндекса», а потом добавили в пользовательское соглашение пункт о возможной передаче данных правоохранительным органам.

Представителям Audacity и Muse Group пришлось отказываться от своих планов и объяснять пользователям, почему спустя 20 лет вдруг понадобилось собирать их данные.

Однако главная проблема Audacity не в желании собирать данные — в 2021 году сложно найти приложение, которое их не собирает, пишут Ars Technica и Gizmodo. Недовольство связано с тем, что команда не обсудила изменения с сообществом, ведь программы с открытым кодом выбирают в том числе из соображений сохранить свои данные при себе.

«Вы не понимаете сути программ с открытым исходным кодом»

Пользовательское соглашение Audacity обновила 2 июля. Команда прописала, что теперь приложение может собирать некоторые данные для аналитики и улучшения:

  • Название и версию операционной системы.
  • Страну проживания пользователя (геолокацию по IP-адресу).
  • Модель центрального процессора.
  • Отчёты о сбоях в формате Breakpad MiniDump, а также коды и сообщения о некоторых ошибках при использовании (например, когда проект не открывается).

Ещё один пункт в списке гласил: «Данные, необходимые для правоохранительных органов, судебных разбирательств и запросов властей». Но что относится к этим данным, команда не уточнила. Из-за такой неопределённости этот пункт звучит угрожающе, комментируют Ars Technica и Gizmodo. Но указывают, что интернет-компании не могут не выполнять законные запросы правоохранительных органов.

IP-адрес пользователя будет храниться на серверах Audacity в течение суток, а затем в виде закодированного хеша — ещё год, после чего удаляется, прописано в соглашении. Другая информация, например, версия операционной системы или центрального процессора, не позволяет идентифицировать пользователя, отметили в компании.

Все ваши данные хранятся на наших серверах в Европейской экономической зоне. Однако иногда от нас требуется передавать ваши персональные данные нашему главному офису в России и нашему внешнему советнику в США.

из пользовательского соглашения Audacity
, от 2 июля

Когда изменения заметили пользователи, Audacity столкнулась с критикой: сперва в англоязычном сообществе — на GitHub и Reddit, затем в России — например, на DTF и OpenNet. Пользователи и разработчики программ с открытым исходным кодом обвинили Audacity и Muse Group в шпионаже. Некоторые призывали удалить приложение, а сторонние разработчики взялись за создание форков без сбора данных пользователей.

Audacity развёрнуто ответила на критику через три дня: 5 июля руководитель стратегического отдела Muse Group Дэниел Рэй заявил, что команда вместе с юристами исправляет пользовательское соглашение, чтобы «чётче изложить» политику работы с данными и «ясно обозначить свои намерения».

Перед текстом пользовательского соглашения на сайте Audacity сейчас написано, что это черновик документа и он не вступит в силу до выхода версии программы 3.0.3. Но перед выпуском соглашение изменят.

Дэниел Рэй заверил, что компания планирует собирать «очень ограниченные» объёмы данных: IP-адрес, который хешируется через 24 часа, версию ОС и тип процессора. Передавать эту информацию правоохранительным органам Muse Group будет только по решению суда, подчеркнул менеджер.

Если пользователь выберет режим автономного использования Audacity, то на эту ситуацию не распространяется политика конфиденциальности.

Мы понимаем, что неясные формулировки в политике конфиденциальности вызвали серьёзные опасения по поводу того, как мы используем и храним данные, которые собираем. В ближайшее время мы опубликуем исправленную версию.

Дэниел Рэй, руководитель стратегического отдела Muse Group

Если объяснения и внесли какую-то ясность, для сообщества компания отреагировала «слишком поздно». Заявление Рэя получило 138 лайков и 458 дизлайков. Два самых популярных комментария — о недоверии Muse Group и переходе на форки.

После телеметрии, лицензии CLA и этой истории вы по-прежнему ждёте доверия от сообщества? Muse на фундаментальном уровне не понимает суть программного обеспечения с открытым исходным кодом. Я жду форка, а до тех пор останусь на версии Audacity до Muse.

TechandMusic462, 362 лайка, 26 дизлайков

Знаете, слишком поздно. Вы уже уничтожили всё добродушие сообщества. Благодаря CLA, предлагаемой политике конфиденциальности и (неудачной) попытке добавить телеметрию мы точно знаем, что вы пытаетесь сделать. Форки уже в разработке.

Muse понятия не имеет, как работает FLOSS-сообщество, — и сообщество это видит. Сжечь Audacity дотла — хорошая работа.

gunqqer, 232 лайка, 16 дизлайков
Audacity пытается объяснить, что щитсторм из-за пользовательского соглашения был зря, но кажется получилось не очень
https://github.com/audacity/audacity/discussions/1225 https://t.co/AhMPFUvW9l

«Спасибо, что прислушались к сообществу»

В похожую ситуацию Audacity попадала ещё раньше: 4 мая команда объявила о решении подключить Google Analytics и «Яндекс.Метрику» для базовой аналитики работы с программой.

Команда хотела собирать:

  • Данные о количестве ежедневных пользователей. Для этого разработчики выбрали «Яндекс.Метрику», для всего остального — Google Analytics. Оба сервиса также записывают IP-адреса пользователей.
  • Начало и конец сеанса.
  • Сообщения об ошибках.
  • Информацию об использовании эффектов, генерации звуков и инструментов для анализа. Разработчики Audacity объясняли, что такие сведения помогут определить приоритеты будущих улучшений.
  • Формат файлов для импорта и экспорта.
  • Версию операционной системы и Audacity.

Отслеживать сеансы Audacity планировала с помощью UUID (уникальный идентификатор), который генерируется и хранится на устройстве пользователя.

В своём объявлении компания отметила, что сбор телеметрии — «необязательный и его можно настроить в любое время», а если пользователь отключит обмен данными — функции телеметрии не будут выполнять никаких операций (no-operation-процесс).

Сама по себе телеметрия — распространённая практика среди современных сервисов, включая приложения с открытым исходным кодом, отмечает Ars Technica. Например, данные телеметрии собирает Mozilla Firefox.

Из оригинального заявления кажется, что Audacity сделала сбор телеметрии включенным по умолчанию — в этом проблема, объясняет издание. Хотя Firefox так же по умолчанию собирает технические данные и данные об использовании.

Пользователи остались недовольны тем, что компания решила собирать данные без их согласия. Особенно их беспокоила передача данных Google и «Яндексу». Под объявлением на GitHub развернулось обсуждение на 1200 комментариев, а сама публикация получила больше 3000 дизлайков и только 249 лайков.

Я знаю, что своим комментарием не остановлю появление этой функции в Audacity. Но я всё равно хочу выразить своё несогласие.

Я приветствую перспективы развития, проект определённо заслужил некоторые обновления. Но меня беспокоит использование аналитики с принципиальной точки зрения.

Мы живём в мире, где почти за каждым нашим шагом в интернете и многими действиями в реальности кто-то следит. Наблюдение стало чем-то вроде нормы, большинство людей просто смирились с ним и не подвергают сомнению его необходимость. [...]

Большинство пользователей привыкло думать, что отслеживание уже в порядке вещей. Многие нажимают «ОК» или «да», чтобы закрыть раздражающее окно с соглашением, не разбираясь, на что они соглашаются. Такое согласие сложно назвать осознанным.

Как я уже сказал, я рад, что Audacity получил внимание и любовь с точки зрения дизайна. Я очень рад возможным улучшениям проекта. Но меня беспокоит использование аналитики, особенно от крупных компаний, которые гоняются за данными (Google и «Яндекс»).

Если вы хотите знать, что ваши пользователи думают о чём-либо, просто спросите нас. Прямо и открыто. Не шпионьте за нами.

spacekookie, 443 лайка, 5 дизлайков

Думаю, вы обязаны объяснить аудитории, что планируете делать с этими данными и как это поможет самим пользователям. И без расплывчатых фраз типа «это поможет нам улучшить Audacity», а с конкретикой.

Сбор данных о пользователях это одно, а их отправка в Google и «Яндекс» — совсем другое. Я бы почувствовал себя обманутым, если думал, что делюсь данными с разработчиками Audacity, а позже узнал, что заодно ещё с Google и «Яндексом».

Be-ing, 184 лайка, один дизлайк

Google — монополист и недобросовестный игрок. Я не хочу, чтобы его шпионские программы были в Audacity. Пожалуйста, не подключайте их ни в каком виде.

Я слишком много времени потратил на попытки избавиться от Google, и потому не хочу беспокоиться, что Audacity передаст ему мои данные, когда я слушаю или работаю с музыкальными треками. Я просто перестану пользоваться приложением.

Телеметрия так или иначе не слишком полезна. На мой взгляд, не стоит того, чтобы оправдывать продажу пользователей очень крупной компании по слежке.

axb21, 153 лайка, один дизлайк

7 мая, после негативной реакции сообщества, разработчики обновили своё сообщение и добавили, что:

  • Сбор телеметрии по умолчанию отключен.
  • Телеметрия работает только только в сборках, созданных через GitHub CI из официального репозитория. URL-адреса телеметрии определены только там.
  • Любой, кто компилирует Audacity из исходного кода, получит возможность включить код телеметрии через систему CMake. По умолчанию опция телеметрии отключена.

В компании также постарались яснее объяснить, зачем нужны данные телеметрии:

  • Понимать, насколько стабильно приложение работает на разных платформах.
  • Оценивать размер аудитории.
  • Решать, какие версии операционных систем поддерживать.
  • Оценивать серьёзность проблем в приложении и расставлять приоритеты при их решении.

А 13 мая Audacity вовсе отозвала своё объявление и выпустила другое заявление — об отказе от сбора телеметрии через Google, «Яндекс» и другие сторонние инструменты. Вместо этого компания намерена самостоятельно собирать данные из отчётов об ошибках и проверять наличие обновлений.

Команда Audacity также признала, что неверно построила коммуникацию с пользователями, из-за чего они не поняли намерения компании и стали тревожиться о своих данных.

Мы абсолютно не заинтересованы в сборе и продаже ваших персональных данных, и Audacity навсегда останется бесплатным проектом с открытым исходным кодом. Благодаря реакции на объявление в Muse Group осознали, что удобство использования Google и «Яндекса» идёт вразрез с отношением сообщества к надёжности.

Я считаю, мы ошиблись в коммуникации, из-за чего столкнулись с большим непониманием. Телеметрия — практический инструмент, который многое говорит нам о работе и эффективности приложения. Например, часто ли пользуются новой функцией или насколько заметна кнопка?

Мы предполагали, что отключение сбора телеметрии по умолчанию развеет опасения насчёт проблем с конфиденциальностью. Но этого не случилось, поэтому пока мы отказываемся от этой функции.

Мартин Кири
, отвечает за Audacity в составе Muse Group

На это заявление Audacity сообщество GitHub отреагировало иначе — 430 лайков и 24 дизлайка.

Хорошая работа. Пока данные не уходят в Google, «Яндекс», Microsoft или Amazon, мы должны быть счастливы.

Соберите нужные вам данные и храните у себя в закрытом виде, сделайте opt-in (отключите сбор по умолчанию — vc.ru). И мы вам поможем.

Спасибо за то, что прислушались к нам и всё разъяснили.

Megaf, 74 лайка, 7 дизлайков

«Увы, участникам текущего обсуждения мало интересны наши ответы и, в целом, ничего кроме громкого заголовка», — писал техлид Audacity Дмитрий Веденко в обсуждении на DTF, где пользователи спорили о слежке со стороны Audacity.

Обсуждение с комьюнити было и реализовано в итоге именно то, о чём договаривались. Предложенный вариант был встречен сообществом положительно.

Проблема в том, что люди из группы, которая участвовала в этом обсуждении, практически не пересекается с группой, которая сейчас создаёт информационный фон вокруг Audacity.

Проблема лежит исключительно в поле public relations. На текущий момент развесистая privacy policy — это современная реальность, особенно если ты оперируешь в EU/US.

Даже если твой сервер тупо сохраняет IP в логе, потому что ты не поменял дефолтный конфиг — у тебя уже проблемы.

Передача данных силовым ведомствам при наличии ордера, решения суда или иного документа, предусмотренного законодательством страны, это тоже не что-то опциональное.

Дмитрий Веденко
, техлид Audacity

Нервозность пользователей можно понять, пишет Gizmodo: популярный музыкальный редактор существует 20 лет и вдруг внезапно обновляет пользовательское соглашение. Однако персональные данные точно так же собирают и другие сервисы, особенно крупные, некоторые собирают даже больше, чем Audacity.

Несмотря на шум, Audacity и Muse Group смогли убедить своё реальное сообщество, что компания серьёзно относится к вопросам конфиденциальности пользователей, заключает Ars Technica.

Однако у сообщества ещё остались вопросы без ответов. Например, пользователи не знают, кто стоит за Muse Group, и не понимают, как компания купила проект с открытым исходным кодом и что именно вошло в сделку: право на сам проект или только название и логотип.

0
22 комментария
Написать комментарий...
Mikhail Malyshev

«Увы, участникам текущего обсуждения мало интересны наши ответы и, в целом, ничего кроме громкого заголовка», — писал техлид Audacity Дмитрий Веденко в обсуждении на DTF, где пользователи спорили о слежке со стороны Audacity.

Вот из-за таких Дмитриев Веденко у нас и страна в говне и репутация у пост-советских граждан в мире соотвествующая.

Там пользователи вполне четко выражают в чем у них претензии к nuse - и сам факт сбора данных ни при чем, он просто как дополнительный раздражитель.

Основная же претензия в том, что люди коммитили в опен-сурс проект расчитывая что он таковым останется, а тут вводят лицензию которая по факту позволяет легитно все что они там за года наработали в Audacity взять, и сделать проприетарным продуктом muse, по сути "отобрать Audacity у народа который его построил, и присвоить себе".

Веденка: "им ничего кроме заголовка не интересно, ух, бузотеры...этот, как его там, наро...полюзователи!". 

P.S. Тут конечно еще вопрос вклада важен, может там действительно от-не членов команды Audacity меньше 1% кода, но даже в этом случае такая реакция совершенно некорректная.

Ответить
Развернуть ветку
Rudolf Cunningham
Основная же претензия в том, что люди коммитили в опен-сурс проект расчитывая что он таковым останется, а тут вводят лицензию которая по факту позволяет легитно все что они там за года наработали в Audacity взять, и сделать проприетарным продуктом muse, по сути "отобрать Audacity у народа который его построил, и присвоить себе".

Так это абсолютно нормально. Как и тот факт, что уже вышедшие версии вместе с их исходниками под старыми лицензиями никто не забирает и забрать не может.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Alex

Audacity простенький редактор, чтобы склеить 2 песенки в 1. Зачем собирать данные. Зачем передавать данные в правоохранительные органы . Что преступного в редакторе можно сделать...

Отдел перевода добра на говно. Макулатуры в мусор. 30% любой IT конторы можно выпиннать на улицу.

Ответить
Развернуть ветку
Evgeny Filatov

Настроил ключевые слова, и, когда пользователь, записывая песню, произносит чьи-нибудь (кхм, кхм...) фамилии, то к нему сразу вылетает наряд ОМОНа

Ответить
Развернуть ветку
Максим В

Сейчас все большие компании собирают данные. И за счет этого лучше понимают рынок и проблемы своих продуктов.
Почему если маленькая компания начинает собирать данные, то это такая проблема?  

Пользователей слово Россия испугало? Или Яднекс? Или Google?
Как я понял можно галочку отключить.

Ответить
Развернуть ветку
Николай Замотаев

Пользователям изначально не понравилась телеметрия, в софте, который её никогда раньше не имел. + яндекс/гугл (там парой). Потом - списки собираемых данных. Потом - отношение компании в их адрес "мы вас услышали.... но всё равно сделаем по-своему".

Учитывая последнее - "пока можно отключить (и нет гарантий, что она отключится)".

Ответить
Развернуть ветку
Mikhail Malyshev

Миллион юзеров = солид дата вольюм. Вэлуабл аквизишн :)))

Подозреваю что функционал Audacity тут вообще ни при чем. Сугубо купили продукт ради базы юзеров.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Николай Замотаев

Кхм. И так - дубль раз, теперь там возрастное ограничение на пользователей всплыло (не младше 13 лет). Из-за сбора данных.
Дубль два - в приложении, которое за 20 лет никогда не использовало сеть - впилили сетевой стек, который источник потенциальных багов и уязвимостей.
Дубль три - попытка смены лицензии с чистого GPLv2 на dual + contribution level agreement, с отдачей всех прав на код Muse.
Про двойные лицензии - Qt и KDE, если олды ещё помнят, изначально был closed source, и только потом переехал в opensource. Chromium - не надо врать. Там отдельные лицензии на компоненты, но парной коммерческая/открытая нигде нет.
И да - не хорошо получается, когда изначально открытый проект по чисто открытой лицензии (не MIT, не BSD, а GPLv2) пытаются утащить в коммерческую.

Дубль четыре - русофобией там и не пахнет, зато пахнет репутацией Muse в связи с другими проектами. Можно почитать комментарии. Про Россию - ни слова.

Ответить
Развернуть ветку
Дмитрий Соколов

Простите, а какой смысл хэшировать IP-адреса?

Для IPv4 сопоставить адрес и хэш можно даже простым перебором за секунду, а уж если попутно полную радужную таблицу сохранить, то вообще за микросекунды в следующий раз.

Ответить
Развернуть ветку
Oleg Safronov

Думаю, что имелось в виду хеширование с использование соли. Сопоставить будет проблематично в этом случае.

Ответить
Развернуть ветку
Дмитрий Соколов

Соль откуда-то берётся, и она явно не рандомная из аппаратного ДСЧ, поскольку в таком случае хранить поле вообще не имеет смысла (его нельзя будет использовать как постоянный ключ).

А необходимость сначала посчитать ещё и соль не сделает перебор сильно сложнее.

Не забываем, что речь в первую очередь не про перебор сторонним злоумышленником (от которого соль и призвана спасать), а про возможность для самих владельцев базы восстановить реальные IP за секунды. Ну и смысл в этой показухе с их «типа хэшированием»?

Ответить
Развернуть ветку
Илья Рабченок

Это бизнес, в вк так же было, сначала никакой рекламы и куча пиратки,  а потом продажа мылу и реклама везде еееее

Ответить
Развернуть ветку
Эл Хэлфрид

Пользуются телефонами, которые знают про них все, вплоть до частоты сношений, а тут испугались,  что аудасити передаст силовикам их версию винды. Да любой сайт знает про них больше чем они сами про себя, а тут вдруг нагрянули злодеи мьюз и сломали людям жизнь

Ответить
Развернуть ветку
Денис Орлов

Поставьте firewall и блокните сетевую активность приложения. Это несложно.

Я использую это на iPhone. Мне тоже не нравится, что приложения выходят в сеть некоторые.

Ответить
Развернуть ветку
Николай Замотаев

Так может лучше "не мусорить" ?

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Николай Замотаев

Изначально - телеметрия планировалась в виде opt-out в бинарных сборках для скачивания с сайта - то есть на Windows/Mac OS. С регистрацией КАЖДОЙ пользовательской сессии. И с привязкой к компьютеру (генерируемый UUID) и IP.

Но "не прокатило". Пока не прокатило.

Original PR description:

....
Universal Google Analytics is used to track the following events:

Session start and end
Errors, including errors from the sqlite3 engine, as we need to debug corruption issues reported on the Audacity forum
Usage of effects, sound generators, analysis tools, so we can prioritize future improvements.
Usage of file formats for import and export
OS and Audacity versions

To identify sessions we use a UUID, which is generated and stored on the client machine.

We use Yandex Metrica to be able to correctly estimate the daily active users correctly. We have to use the second service as Google Analytics is known to have some really tight quotas.

Both services also record the IP the request is coming from.

Telemetry collection is optional and configurable at any time. In case of data sharing is disabled - all calls to the telemetry Report* functions are no-op.

Additionally, this pull request comes with a set of libraries to help the future efforts on Audacity.

Ответить
Развернуть ветку
Валентин Хирш

Конечно такие данные как: "его пост собрал 4 лайка и 400 дизлайков" показывают значительный интерес всего человечества к этому вопросу, но мне кажется или это настолько локальная и местечковая тема что всем должно быть наплевать. Или это очередная чудо нативка?

Ответить
Развернуть ветку
Николай Замотаев

Вообще-то это было на github-е, куда ходят разработчики и заинтересованные. Всё человечество там по определению не появляется.
Плюс - на данный момент как минимум один из тредов залочен и раздать лайки и дислайки уже нельзя.

Ответить
Развернуть ветку
Николай Замотаев

deleted

Ответить
Развернуть ветку
Невероятный Блондин
в 2021 году сложно найти приложение, которое их не собирает

Внезапно, но ребята из транспорта Москвы удивили.
Хотя скорее всего они нашли способ через mapbox втихую забирать.
Не зря же их коллеги добавили именно метрику mapbox в «Госуслуги Москвы»

Ответить
Развернуть ветку
19 комментариев
Раскрывать всегда