基于ATMADDPG 算法的多水面无人航行器编队导航

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要: 为提高多无人船编队系统的导航能力, 提出了一种基于注意力机制的多智能体深度确定性策略梯度(ATMADDPG: Attention Mechanism based Multi-Agent Deep Deterministic Policy Gradient) 算法。该算法在训练阶段, 通过大量试验训练出最佳策略, 并在实验阶段直接使用训练出的最佳策略得到最佳编队路径。(剩余9073字)

monitor