Фичи, сгенерированные нейросетью, на тестовой выборке показали себя лучше всего.
Польза всё-таки есть
Всё впереди :)
Вы всё верно расписали :)
Большая часть признаков генерировалось из сырого лога матча, который мы получали напрямую от Valve.
Личные встречи, сыгранные турниры и многие другие стат. данные тоже безусловно учитывались.
Сетка использовалась для кодирования категориальных фичей (например, предметов, которые собрал игрок). Можно было конечно обойтись и стандартным one-hot encoding, но embedding в ходе тестов показал себя сильно лучше. Да и пространство признаков при таком подходе не раздувается.
Кодирование - в смысле сопоставление категориальному признаку числового вектора. Нормализация не производилась. Пустые значения заменялись на средние/медианы.