Все точки данных, находящиеся в круге K=__, получают “голос " относительно того, каким должно быть значение целевой переменной для этой новой точки данных. Значение, которое получает большинство голосов – это значение, которое KNN прогнозирует для новой точки данных. В иллюстрации выше, 2 ближайших соседей – class 1, в то время как 1 соседей – class 2. Таким образом, модель бы спрогнозировала class 1 для этой точки данных. Если модель предсказывает числовое значение, а не категорию, то все «голоса» - числовые значения, которые усредняются, чтобы получить прогноз.
K Значит Кластеризация K Means Clustering
Хмхм
:) даже не заморачивались с переводом
Пожалуйста, приложите ссылку на оригинальный материал. Еще не хватает, видимо, ссылки на Ted Talk.
Кирилл, вот ссылка на оригинальную статью