• 打印
  • 收藏
收藏成功
分享

改进的动态A*-Q-Learning算法及其在无人机航迹规划中的应用

DOI:10.19850/j.cnki.2096-4706.2021.09.001

摘  要:Q-Learning算法是一种基于价值函数的强化学习方法。传统的Q-Learning算法迭代效率低且容易陷入局部收敛,针对该劣势改进了算法,引入A*算法和动态搜索因子ε。将改进后的动态A*-Q-Learning算法应用于三维复杂环境下无人机的航迹规划,分析无人机航迹规划结果的回报函数、探索步数和运行效率。(剩余9543字)

网站仅支持在线阅读(不支持PDF下载),如需保存文章,可以选择【打印】保存。

畅销排行榜
目录
monitor