Обучение с подкреплением (reinforcement learning, RL) — это раздел машинного обучения, в котором агент обучается взаимодействовать с окружающей средой, получая награды или штрафы за свои действия. Этот подход аналогичен обучению животных и людей, которые учатся, опираясь на свой опыт.