深度神经网络低比特量化方法综述

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘  要:近年来,深度神经网络(Deep Neural Networks, DNNs)在计算机视觉和自然语言处理等领域都取得了突破性进展。然而,DNNs通常包含大量参数,并消耗大量的计算资源,这限制了它们在资源受限设备上的部署与应用。为了减少内存占用和计算负担,有关模型压缩与加速的研究工作不断涌现,模型低比特量化是其中主要的方法之一。(剩余24794字)

目录
monitor
客服机器人