特别提示

1.点击网站首页右上角的“充值”按钮可以为您的帐号充值

2.可选择不同档位的充值金额，充值后按篇按本计费

3.充值成功后即可购买网站上的任意文章或杂志的电子版

4.购买后文章、杂志可在个人中心的订阅/零买找到

5.登陆后可阅读免费专区的精彩内容

基于内在奖励的技能获取和组合方法

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

收稿日期：2022-04-04；修回日期：2022-06-01 基金项目：贵州省科学技术基金资助项目（黔科合基础［2020］1Y275）；贵州省科技计划项目（黔科合基础［2019］1130号）

作者简介：赵英（1995-），女，贵州遵义人，硕士，主要研究方向为强化学习（2642123704@qq.com）；秦进（1978-），男，贵州黔西人，副教授，博士，主要研究方向为强化学习、智能计算.

摘要：现有的内在奖励随着agent不断探索环境而逐渐消失，导致了agent无法利用内在奖励信号去指引agent寻找最优策略。（剩余16392字）

试读结束

购买全文6.00元下一篇基于双矫正机制的源域无关域适应学习

计算机应用研究

2022年12期

¥12.00/本

目录

关于龙源 关于我们联系我们龙源大事记诚聘英才用户守则 购刊指南 电子刊购买流程会员介绍常见问题 客服中心 联系客服开具发票 商务合作 商务合作 网络信息举报
违法和不良信息举报电话：400-106-1235

举报邮箱：longyuandom@163.com
网上有害信息举报专区 支付方式 支付宝在线支付公司转账邮局汇款 特色服务 刊社入口友情链接

关注微信公众号
获取更多资讯
北京龙源网通电子商务有限公司
（署）网出证（京）字第188号丨京公网安备 11011302003690号丨京ICP备18053758号-2