注册帐号丨忘记密码?
1.点击网站首页右上角的“充值”按钮可以为您的帐号充值
2.可选择不同档位的充值金额,充值后按篇按本计费
3.充值成功后即可购买网站上的任意文章或杂志的电子版
4.购买后文章、杂志可在个人中心的订阅/零买找到
5.登陆后可阅读免费专区的精彩内容
打开文本图片集
摘要:深度学习中,因卷积巨大的计算需求,经常成为限制大型卷积神经网络性能的瓶颈,为此,提出使用并行技术来优化卷积运算的策略。对传统2D卷积算子进行重构,使其转换为通用矩阵乘法;使用共享内存和数据预取等技术,降低访存次数;针对加速器的硬件架构,调整算法的并行方案以提高计算性能。实验结果表明,相较传统的计算方式,该优化策略将运算速度提升了近7.5倍,提高了卷积运算效率。(剩余9317字)
登录龙源期刊网
购买文章
基于img2col的2D卷积算子在DCU加速器上的并行优化研究
文章价格:5.00元
当前余额:100.00
阅读
您目前是文章会员,阅读数共:0篇
剩余阅读数:0篇
阅读有效期:0001-1-1 0:00:00