Для того, чтобы представить полную картину рынка, мы поработали с семантикой. Выделили брендовые запросы (названия школ), запросы по предметам (“Курсы питон”, “Обучение нейросети”), и в отдельную группу вынесли запросы, где предмет сочетается с названием школы (они явно показывают преимущество той или иной школы в предмете). Проработали все варианты написания, как брендов, так и предметов (один только Python имеет 5 вариантов написания). Загрузили все данные в нашу модель нормирования по регионам, которая дает поправки с учетом количество населения, активного в Интернете, для каждого региона (иначе данные получаются некорректными). Затем рассчитали ключевые параметры: доли по спросу, коэффициенты аффинитивности и прочие интересные вещи.