基于深度强化学习CLPER-DDPG的车辆纵向速度规划

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：为了解决车辆纵向速度规划任务中规划器不易收敛以及在多场景之间切换时稳定性差的问题，基于多层感知机设计了车辆纵向速度规划器，构建了结合优先经验回放机制和课程学习机制的深度确定性策略梯度算法。该文设计了仿真场景进行模型的训练和测试，并对深度确定性策略梯度（DDPG）、结合优先经验回放机制的深度确定性策略梯度（PER-DDPG）、结合优先经验回放机制和课程学习机制的深度确定性策略梯度（CLPER-DDPG）3种算法进行对比实验，并在园区内的真实道路上进行实车实验。（剩余10930字）

试读结束

购买全文6.00元下一篇公交-合乘车道优化设计的多目标双层规划模型

汽车安全与节能学报

2024年05期

¥4.90/本