基于轨迹引导的移动机器人导航策略优化算法

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：针对在杂乱、障碍物密集的复杂环境下移动机器人使用深度强化学习进行自主导航所面临的探索困难，进而导致学习效率低下的问题，提出了一种基于轨迹引导的导航策略优化（TGNPO）算法。首先，使用模仿学习的方法为移动机器人训练一个能够同时提供专家示范行为与导航轨迹预测功能的专家策略，旨在全面指导深度强化学习训练；其次，将专家策略预测的导航轨迹与当前时刻移动机器人所感知的实时图像进行融合，并结合坐标注意力机制提取对移动机器人未来导航起引导作用的特征区域，提高导航模型的学习性能；最后，使用专家策略预测的导航轨迹对移动机器人的策略轨迹进行约束，降低导航过程中的无效探索和错误决策。（剩余16118字）

试读结束

购买全文6.00元下一篇多搬运任务下考虑碰撞避免的AGV路径规划

计算机应用研究

2024年05期

¥12.00/本