软硬件协同设计的异构CNN加速器

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要: 为解决卷积神经网络(CNN)高效部署的挑战,提出一种基于软硬件协同设计的异构CNN加速器,并在YOLOv4-tiny模型上进行验证。搭建基于高级精简指令集机器(ARM)处理器与现场可编程门阵列(FGPA)的异构系统。通过高层次综合(HLS)将可并行执行的计算单元映射为FPGA端寄存器传输级(RTL)知识产权(IP);ARM处理器控制系统的协同工作与IP核的调度,最终实现前向推理加速。(剩余13973字)

monitor