多头自注意力机制的Faster R⁃CNN目标检测算法

打开文本图片集
摘 要: 文中提出一种融合多头注意力机制、ROI Align和Soft⁃NMS的Faster R⁃CNN目标检测算法,旨在解决原始Faster R⁃CNN目标检测网络中存在的检测精度低、漏检、误检的问题。首先,为了提高Faster R⁃CNN的感知能力,提取特征图中的重要特征并降低对无关特征的提取,在网络中嵌入注意力机制;接着,针对共享全连接层的降维操作导致的一些区域的细节信息被忽略,造成局部信息的丢失,采用一维卷积代替共享全连接层实现权重计算的任务,以捕捉更广泛的空间信息;然后为了提供更丰富的特征表达能力,在注意力机制中引入多头机制分别对特征的不同部分进行重要性的加权;为了减少在特征提取时原图信息的丢失,使用ROI Align替换ROI Pooling算法;最后,在算法后处理中引入Soft⁃NMS替换传统非极大抑制(NMS)算法以减少漏检和误检情况。(剩余13239字)