Как пополнять базы обратного поиска по номеру телефона

Телефонный спам — один из худших видов спама, о котором недостаточно говорят. Чисто электронный спам оказалось относительно легко победить: когда последний раз спам пробивался в ваши входящие на Gmail? Алгоритмы достаточно эффективно фильтруют почтовый спам и ботов в комментариях. Однако в аналоговой среде спам победить гораздо сложнее, и телефонный спам — настоящий бич современности, практически убивающий культуру телефонных звонков.

Как пополнять базы обратного поиска по номеру телефона

При этом звонки с незнакомых номеров часто поступают с иностранных номеров. И как отличить номер мошенника от номера зарубежного сервиса, оповещающего тебя о попытке взломать твой WhatsApp, например?

Чтобы понять, как работает reverse phone lookup (обратный поиск по номеру телефона), сначала необходимо знать некоторые основы о телефонных номерах и каталогах. Современные сервисы обратного поиска, по сути, воссоздают традиционные печатные телефонные справочники, в которых перечислялись имена, адреса и номера телефонов людей и компаний, пожелавших быть в списке.

Такие сайты, как num.tel, с обратным поиском по телефону, объединяют различные общедоступные и частные источники данных для создания доступных для поиска каталогов поиска людей.

Вот некоторые из источников, которыми пополняются такие справочники:

1. Данные операторов. Операторы связи лучше всех знают, кому принадлежит конкретный номер телефона. Естественно, это закрытая информация, однако у некоторых операторов связи есть соглашения о лицензировании коммерческих данных с крупными поисковыми службами или брокерами данных. Это позволяет ограничить доступ к записям своих подписчиков для целей поиска.

2. Госданные. Многие правительственные учреждения собирают информацию о телефонных абонентах для нормативных требований, реагирования на чрезвычайные ситуации и других целей. В России к таким данным официально получить доступ нельзя, однако в некоторых западных странах эти базы либо являются общедоступными или к ним можно получить доступ по формальному запросу, поэтому глобальные сервисы обратного поиска могут добавлять их в базу тоже.

3. Бизнес-каталоги. Самый очевидный источник в reverse phone lookup-сервисах — данные, которые компании сами о себе публикуют в «Яндекс-картах», 2ГИС или каталогах вроде Yellow Pages.

4. Сайты поиска людей. Крупные поисковые системы контактов, такие как Whitepages, BeenVerified и Spokeo, имеют свои собственные каталоги, созданные путем агрегирования многих источников общедоступной информации, а также некоторых частных источников данных. В их базах данных можно искать связи между именами, адресами, номерами телефонов и другими деталями. Лицензируя доступ к этим совокупным общедоступным записям и ресурсам брокера данных, службы обратного поиска могут предоставлять информацию о подписчиках как по номерам стационарных, так и по мобильным телефонам, в отличие от бизнес-справочников.

5. Парсинг веб-страниц. Некоторые сайты обратного поиска телефонов парсят открытые источники информации, социальные сети, объявления о продаже и сообщения на форумах в поисках связок номеров телефона и имени. Например, сбор тематических объявлений, сообщений на форумах или других общедоступных веб-страниц, на которых кто-то поделился своим номером телефона. Этот подход обычно обеспечивает совпадения низкого качества по сравнению с поиском в полных каталогах. Но это недорогой вариант для базовых поисковых сайтов.

6. Базы, генерируремые пользователями. Это самый очевидный способ пополнения баз обратного поиска номеров: люди сами делятся информацией о том, кто звонил с незнакомого номера, особенно если это были мошенники, реклама или коллекторы. За счет краудсорсинга базы обратного поиска таким образом пополняются актуальной и уникальной информацией, которую нельзя найти никакими другими способами.

Главная проблема этой области — недостаток госрегулирования, как в отношении запрета телефонного спама, так и координации сборов подобных баз данных. Сейчас каждый сервис собирает такие базы сам по себе — в результате, обратный поиск страдает от сильной фрагментации, а отдельные базы остаются совершенно бесполезными.

Хотя говорить по телефону и о телефонных звонках в интернет-эру вообще не принято, всё равно с этим надо что-то делать.

Начать дискуссию