基于数据增强的深度学习声学场景分类算法

打开文本图片集
摘 要:根据卷积神经网络具有学习能力强、可移植性高的优点,结合数据增强可提升模型泛化能力的特点,提出了一种基于数据增强的深度学习声学场景分类方法,其次构建基于VGG16和Mixup的声学场景分类模型,最后在ESC-50数据集上对实验模型进行广泛的测试。实验结果表明,使用Mixup数据增强方法能够提升6.44%的模型准确率,且模型在该数据集上获得了81.56%的分类准确率,优于基线系统37.26%的准确率,验证了该方法的可靠性和有效性,且能够有效提高模型的分类效果。(剩余8047字)