基于不确定性的贝叶斯策略重用方法

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：针对多智能体对抗中因对手策略变化导致的非平稳性问题，在对手动作不可获取的限制下，提出一种基于不确定性的贝叶斯策略重用算法。在离线阶段，在策略学习的同时，通过自编码器建模智能体轨迹与对手动作之间的关系表征以构建对手模型。在在线阶段，依据对手模型和有限交互信息，估计对手策略类型的不确定性，并基于此选择最优应对策略并重用。（剩余17764字）

试读结束

购买全文6.00元下一篇基于结构化数据的区域保障调度模型研究

系统工程与电子技术

2025年02期

¥24.00/本

关于龙源 关于我们联系我们龙源大事记诚聘英才用户守则 购刊指南 电子刊购买流程会员介绍常见问题 客服中心 联系客服开具发票 商务合作 商务合作 网络信息举报
违法和不良信息举报电话：400-106-1235

举报邮箱：longyuandom@163.com
网上有害信息举报专区 支付方式 支付宝在线支付公司转账邮局汇款 特色服务 刊社入口友情链接

关注微信公众号
获取更多资讯
北京龙源网通电子商务有限公司
（署）网出证（京）字第188号丨京公网安备 11011302003690号丨京ICP备18053758号-2