Расскажем про построение модели, способной предсказать негативные комментарии.Во-первых, подготовим датасет с размеченными данными. Все комментарии мы разделим на два класса: негативные (target — 1) и позитивные (target — 0).
Спасибо за статью. А почему именно random forest решили использовать?
Антон, спасибо! Считаем, что random forest - один из лучших алгоритмов машинного обучения. Он универсален, его можно использовать во многих задачах - классификация, кластеризация и других. Поэтому для решения этой задачи остановились на нем.