Наивный Байесовский классификатор для фильтрации спама

Использование наивного Байесовского классификатора для фильтрации спама — довольно старый и известный способ фильтрации сообщений. В его основе лежит простая идея – на обучающих данных для каждого слова в сообщении вычисляется оценка вероятности того, что письмо с этим словом является спамом и, исходя их этого, для вновь пришедшего письма на основа…

1010

А если проверить - есть ли у письма марка? Если есть - то это дорогой спам, а если нет - то точно спам.
Письма с адресов апрувленных владельцем почтового ящика вряд ли будут спамом. Остальные - за борт.
Еще можно присылать один цифровой доллар адресату с тем чтобы если все ок, в ответ этот доллар присылался назад.
А если не ок - сами понимаете.