异构计算环境下NPU架构与深度学习加速方法

  • 打印
  • 收藏
收藏成功

摘要:当前,随着异构计算技术的快速发展,如何高效部署深度神经网络成为业界关注的焦点。文章重点研究了面向边缘场景的神经网络加速技术,通过剖析现有NPU架构的优缺点,提出了一套低功耗加速方案。该方案有效结合了流水线并行与循环展开技术,显著提升了计算资源利用率,同时在数据调度与存储管理方面实现了有效优化。(剩余5480字)

目录
monitor