Комментарии – Александр Красных (@id198375)

в посте

Как мы делали нейросеть для прогнозов на TI 8, батлили с GOSU, схватили бан на Reddit, и чем это всё закончилось :D 01.09.2018

Кодирование - в смысле сопоставление категориальному признаку числового вектора. Нормализация не производилась. Пустые значения заменялись на средние/медианы.

1

Ответить

Александр Красных

в посте

Как мы делали нейросеть для прогнозов на TI 8, батлили с GOSU, схватили бан на Reddit, и чем это всё закончилось :D 01.09.2018

Фичи, сгенерированные нейросетью, на тестовой выборке показали себя лучше всего.
Польза всё-таки есть

1

Ответить

Александр Красных

в посте

Как мы делали нейросеть для прогнозов на TI 8, батлили с GOSU, схватили бан на Reddit, и чем это всё закончилось :D 01.09.2018

Всё впереди :)

Ответить

Александр Красных

в посте

Как мы делали нейросеть для прогнозов на TI 8, батлили с GOSU, схватили бан на Reddit, и чем это всё закончилось :D 01.09.2018

Вы всё верно расписали :)
Большая часть признаков генерировалось из сырого лога матча, который мы получали напрямую от Valve.
Личные встречи, сыгранные турниры и многие другие стат. данные тоже безусловно учитывались.

2

Ответить

Александр Красных

в посте

Как мы делали нейросеть для прогнозов на TI 8, батлили с GOSU, схватили бан на Reddit, и чем это всё закончилось :D 01.09.2018

Сетка использовалась для кодирования категориальных фичей (например, предметов, которые собрал игрок). Можно было конечно обойтись и стандартным one-hot encoding, но embedding в ходе тестов показал себя сильно лучше. Да и пространство признаков при таком подходе не раздувается.

3

Ответить