Вывод формулы разделительной линии «наивного» байесовского классификатора
Введение
В данной статье рассмотрим вывод формулы разделительной линии «наивного» байесовского классификатора для случая, когда все объекты выборки имеют один вес (одинаковый штраф за ошибку классификации).
Пусть выборка состоит из двух классов и двух признаков объектов. Пусть оба признака являются числовыми.
Рассмотрим вывод формулы.
Логарифмируем:
Пусть
Тогда
Пусть
Тогда
Полученная формула позволяет не перебирать всё пространство возможных объектов. Для построения разделительной линии достаточно перебрать значения лишь одного из признаков. В общем случае, если признаков m, то асимптотическая сложность алгоритма построения разделительной линии O(Xm-1), где X – диапазон значений признаков (для простоты изложения будем считать, что пространство X значений признаков одинаково).