改进的动态A*-Q-Learning算法及其在无人机航迹规划中的应用

DOI：10.19850/j.cnki.2096-4706.2021.09.001

摘要：Q-Learning算法是一种基于价值函数的强化学习方法。传统的Q-Learning算法迭代效率低且容易陷入局部收敛，针对该劣势改进了算法，引入A*算法和动态搜索因子ε。将改进后的动态A*-Q-Learning算法应用于三维复杂环境下无人机的航迹规划，分析无人机航迹规划结果的回报函数、探索步数和运行效率。（剩余9543字）

~~试读结束~~

购买全文5.00元打印文章

网站仅支持在线阅读（不支持PDF下载），如需保存文章，可以选择【打印】保存。

下一篇基于卷积神经网络的玉米病害识别

畅销排行榜

我国个人移动支付工具发展现状

现代信息科技 2017年02期

“大数据”支持下湖南省公共安全管理能力提升研究

现代信息科技 2017年03期

现代信息科技

2021年09期

电子价￥18.00元

购买