IBM создала базу с фото из Flickr для обучения систем распознавания лиц — но не спросила их авторов и героев

Как и другие компании, которые берут снимки из интернета для исследований.

IBM использует базу с фотографиями из Flickr для обучения систем распознавания лиц. При этом компания не получала согласие фотографов и сфотографированных, говорится в расследовании NBC News.

Фото, которые использует IBM — часть большей базы на 99 млн фото, которую бывший владелец фотосервиса Flickr компания Yahoo собрала для исследовательских целей. Фото были переданы по лицензиям Creative Commons, но вряд ли хотя бы одна из них учитывала использование снимков для обучения алгоритмов распознавания, пишет The Verge.

Люди, изображённые на снимках, могут быть против такого использования своих фото, считает издание. Например, их лица могут оказаться в базе данных систем для распознавания лиц по этническому признаку, поясняет издание.

В IBM заявили, что доступ к фото могут получить только проверенные исследователи, а сами снимки из базы были общедоступными. В компании добавили, что пользователи могут попросить компанию удалить их, прислав им ссылки на изображения. Но это сложно — ведь IBM сделала доступ к базе закрытым. Кроме того, фото останутся у компаний, которые уже получили доступ к базе.

Журналисты NBC News, которые получили к ней доступ, создали специальную форму: пользователи могут ввести свой ник на Flickr и узнать, есть ли их фото в базе IBM для обучения систем распознавания лиц.

IBM не единственная компания, которая собирает фото для исследований из интернета — так делают десятки организаций, пишет NBC News. На старте создания систем распознавания лиц исследователи платили людям и просили подписать специальные соглашения, чтобы сделать фото.

Но с появлением интернета они получили доступ к миллионам фото, людей на которых системы классифицируют по возрасту, полу, цвету кожи и другим метрикам. Это вызывает вопросы у экспертов и юристов, особенно в сфере защиты этнических и других меньшинств, поясняет NBC News.

99
11 комментариев

Всё, что попало в интернет - становится достоянием интернета. По этой причине я не выкладываю в него личные фотографии от слова никак. Скоро будет, что любой документ на компьютере - достояние интернета.

8
Ответить

+1
всё, что хоть раз попало в интернет, остаётся там навсегда (привет адвокату бейонсе xD)

Ответить

А у нас просто парсят фотки с Вконтакта и не парятся, не только не ограничивают доступ к базе только для "проверенных исследователей", но даже открывают публичный поиск по лицам для любого анонимного двачера в интернете. Хорошо в стране советской жить.

1
Ответить

Гм, фотографии в открытом доступе, поэтому какая разница-то? Вы сами выложили их.

4
Ответить

Привыкайте.

Ответить

Спасайтесь, а то он и вас посчитает!

1
Ответить