基于深度确定性策略梯度的船舶自主航行避碰方法

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要:针对不同会遇态势下的船舶自主航行避碰决策问题,在DDPG(Deep Deterministic Policy Gradient)算法基础上,以国际航行规则(COLREGS)为基准设计相应的奖励函数,通过引入势能回报塑形的思想来引导智能体学习最佳策略,保障了智能体在遵守规则的前提下能够有效避障到达航行目标点。(剩余12999字)

monitor
客服机器人