基于组合训练的规则嵌入多智能体强化学习方法

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：多智能体强化学习方法在仿真模拟、游戏对抗、推荐系统等许多方面取得了突出的进展。然而，现实世界的复杂问题使得强化学习方法存在无效探索多、训练速度慢、学习能力难以持续提升等问题。该研究嵌入规则的多智能体强化学习技术，提出基于组合训练的规则与学习结合的方式，分别设计融合规则的多智能体强化学习模型与规则选择模型，通过组合训练将两者有机结合，能够根据当前态势决定使用强化学习决策还是使用规则决策，有效解决在学习中使用哪些规则以及规则使用时机的问题。（剩余14727字）

试读结束

购买全文6.00元下一篇基于网络结构搜索的工业过程自动故障诊断方法

计算机应用研究

2022年03期

¥12.00/本