基于音频的多特征融合低慢小目标探测研究

打开文本图片集
摘 要: 无人机逐渐成为现代战争的重要侦察与打击手段,对于低慢小目标的探测与识别变得越来越重要。音频作为一种重要的感知模态,在目标探测中具有独特的优势,特别是在无线电频谱资源受限或图像信息不可用的情况下。针对该问题,文中提出一种基于音频的多特征融合方法用于对低慢小目标进行探测。模型采用两分支结构:第一个分支通过在音频数据的梅尔语谱图上提取特征,设计一种全新的LLSIncepNeXt模块,通过并行的卷积核提取时间与频率两个维度的信息;另一个分支将音频的MFCC特征直接输入到双向GRU提取时序特征,随后将两个分支提取到的特征进行融合,并通过多头注意力机制强化重点特征,区别不同特征的贡献程度。(剩余6805字)