深度学习技术在音频自动标注中的应用研究

  • 打印
  • 收藏
收藏成功

摘  要:自动音频标注的目的是从音频输入生成能够描述此音频的一段文字。目前,音频标注模型的效果欠佳,并且在改善音频标注效果的过程中很少有应用预加载模型。自动音频标注的目标为音频片段产生合适的描述语句,要能够拥有处理音频模态和文本模态数据的能力。为此,对音频模态及文本模态的预加载模型进行研究,并提出基于音频模态的自动标注和基于文本模态的自动标注,解决传统标注方法中训练和测试阶段目标不一致的问题。(剩余5182字)

目录
monitor