基于注意力哈希融合对比损失的鸟鸣声识别

打开文本图片集
摘 要:针对自然环境中采集的鸟鸣声数据存在的长度不对齐性、冗余性、噪声、类内差异大的问题,提出一种由基于多级注意力的两阶段哈希算法和由融合对比损失轻量级分类器构成的自动化鸟鸣声识别模型。哈希算法一阶段解决冗余性和噪声的问题,首先将对数梅尔频谱图分块并计算每个片段之间的自注意力,提取计算得到的多级自注意力权重矩阵,然后利用自定义抑噪系数加权后的权值矩阵裁切输入中的冗余和噪声片段;哈希算法二阶段解决输入维度不对齐的问题,利用多级注意力构建的关联式权重矩阵筛选输入片段,实现维度归一化。(剩余18102字)