驾驶行为机器人仿真环境与拥堵算法的研究

  • 打印
  • 收藏
收藏成功

摘 要:目的 强化学习具有较强的感知能力,但是缺乏一定的决策、能力,而强化学习具有决策能力,对感知问题束手无策。因此,将两者结合起来,即为深度强化学习,优势互补,为复杂系统的感知决策问题提供了解决思路。在现实生活中,我们出行会受到多种因素的影响,人类通过多次的驾驶,驾驶水平会越来越高,机器人也是同样如此。(剩余8008字)

目录
monitor