基于TD3-PER 的智能车辆跟驰策略研究

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要:针对自动驾驶中复杂跟驰场景,提出了一种基于优先经验回放的双延迟深度确定性策略梯度(TwinDelayedDeepDeterministicPolicyGradientwithPrioritizedExperienceReplay,TD3-PER)算法的车辆跟驰控制策略。该策略结合安全性、舒适性和效率设计奖励函数,并引入容忍范围机制和优先经验回放算法,以提升适应性和训练效率。(剩余338字)

monitor
客服机器人