Так называемое обучение с подкреплением (RL, reinforcement learning) использует агентов, которые играют в компьютерной среде, зная на входе только правила игры, и потом, научившись методом проб (поощряемых в случае выигрыша) и ошибок, справляются с лучшими игроками и даже командами из реального мира.
И? Результаты практические где? Обычная болтовня
О результатах в нашей следующей статье: stay tuned ;)