暂无介绍
引言 强化学习〔Reinforcement Learning, RL〕是一种通过与环境交互来学习决策策略方法,伴随应用范围不息扩大,特别是涉及到大规模、复杂场景时,如自动驾驶、机器人导航等领域,强化学习面对一个根本挑战是高维状态空间与动作空间难题,本文旨在探讨如何有效应对这一挑战,并提出相应搞定方案