一种基于梯度的多智能体元深度强化学习算法

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：多智能体系统在自动驾驶、智能物流、医疗协同等多个领域中广泛应用，然而由于技术进步和系统需求的增加，这些系统面临着规模庞大、复杂度高等挑战，常出现训练效率低和适应能力差等问题。为了解决这些问题，将基于梯度的元学习方法扩展到多智能体深度强化学习中，提出一种名为多智能体一阶元近端策略优化（MAMPPO）方法，用于学习多智能体系统的初始模型参数，从而为提高多智能体深度强化学习的性能提供新的视角。（剩余15962字）

试读结束

购买全文6.00元下一篇基于知识图谱的多特征融合谣言检测方法

计算机应用研究

2024年05期

¥12.00/本