基于改进的视觉注意力机制的图像描述方法

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：为了解决所生成的图像描述语句不准确的问题，提出一种基于注意力机制和强化学习的三层LSTM网络图像描述模型。首先使用ResNet-101网络提取图像的特征信息，再使用改进的三层LSTM网络模型生成描述语句。同时针对采用交叉熵损失函数对模型进行训练时存在的曝光偏差问题，使用强化学习方法直接优化CIDEr评价指标。（剩余7701字）

试读结束

购买全文5.00元下一篇可编辑多边形在三维游戏场景建模中的应用

现代信息科技

2022年09期

¥18.00/本

关于龙源 关于我们联系我们龙源大事记诚聘英才用户守则 购刊指南 电子刊购买流程会员介绍常见问题 客服中心 联系客服开具发票 商务合作 商务合作 网络信息举报
违法和不良信息举报电话：400-106-1235

举报邮箱：longyuandom@163.com
网上有害信息举报专区 支付方式 支付宝在线支付公司转账邮局汇款 特色服务 刊社入口友情链接

关注微信公众号
获取更多资讯
北京龙源网通电子商务有限公司
（署）网出证（京）字第188号丨京公网安备 11011302003690号丨京ICP备18053758号-2