Александр Красных

+7
с 2018
0 подписчиков
26 подписок

Кодирование - в смысле сопоставление категориальному признаку числового вектора. Нормализация не производилась. Пустые значения заменялись на средние/медианы.

1

Фичи, сгенерированные нейросетью, на тестовой выборке показали себя лучше всего.
Польза всё-таки есть

1

Вы всё верно расписали :)
Большая часть признаков генерировалось из сырого лога матча, который мы получали напрямую от Valve.
Личные встречи, сыгранные турниры и многие другие стат. данные тоже безусловно учитывались.

2

Сетка использовалась для кодирования категориальных фичей (например, предметов, которые собрал игрок). Можно было конечно обойтись и стандартным one-hot encoding, но embedding в ходе тестов показал себя сильно лучше. Да и пространство признаков при таком подходе не раздувается.

3