“Страницы, содержащие веб-спам, используют различные техники, чтобы достичь более высоких позиций, чем они заслуживают, в результатах поисковых систем. Хоть эксперты и могут идентифицировать спам, использование ручного труда для оценки множества страниц — слишком дорого. Вместо этого мы предлагаем технику полуавтоматического отделения надежных, хороших страниц от спамных. Сначала мы отбираем небольшую выборку начальных страниц для оценки экспертом. После того, как мы вручную установим надежные начальные страницы, мы используем ссылочную структуру сети, чтобы обнаружить другие вероятно хорошие страницы.
В этом документе мы обсуждаем возможные способы внедрения начального отбора и обнаружения хороших страниц. Мы представляем результаты экспериментов, осуществляемых во всемирной паутине, проиндексированной AltaVista, и оцениваем наши техники. Наши результаты показывают, что мы можем эффективно отфильтровать спам из значительной части Интернета, основываясь на хорошем начальном наборе из менее чем 200 сайтов”.
Статья нудная. Лучше бы ссылку на оригинал опубликовали, зачем этот перевод? Хоть перевели бы без ошибок
Дмитрий, а вы, кстати, заметили, что есть не только ссылка на оригинал, но еще и получено разрешение от правообладателей?) Т.е. всё официально) Учитесь)
Спасибо за перевод статьи. Отличный повод задуматься. В очередной раз.