注册帐号丨忘记密码?
1.点击网站首页右上角的“充值”按钮可以为您的帐号充值
2.可选择不同档位的充值金额,充值后按篇按本计费
3.充值成功后即可购买网站上的任意文章或杂志的电子版
4.购买后文章、杂志可在个人中心的订阅/零买找到
5.登陆后可阅读免费专区的精彩内容
打开文本图片集
摘 要:针对多智能体对抗中因对手策略变化导致的非平稳性问题,在对手动作不可获取的限制下,提出一种基于不确定性的贝叶斯策略重用算法。在离线阶段,在策略学习的同时,通过自编码器建模智能体轨迹与对手动作之间的关系表征以构建对手模型。在在线阶段,依据对手模型和有限交互信息,估计对手策略类型的不确定性,并基于此选择最优应对策略并重用。(剩余17764字)
登录龙源期刊网
购买文章
基于不确定性的贝叶斯策略重用方法
文章价格:6.00元
当前余额:100.00
阅读
您目前是文章会员,阅读数共:0篇
剩余阅读数:0篇
阅读有效期:0001-1-1 0:00:00