深度学习技术在音频自动标注中的应用研究

打印
收藏

收藏成功

微博 QQ空间微信

摘要：自动音频标注的目的是从音频输入生成能够描述此音频的一段文字。目前，音频标注模型的效果欠佳，并且在改善音频标注效果的过程中很少有应用预加载模型。自动音频标注的目标为音频片段产生合适的描述语句，要能够拥有处理音频模态和文本模态数据的能力。为此，对音频模态及文本模态的预加载模型进行研究，并提出基于音频模态的自动标注和基于文本模态的自动标注，解决传统标注方法中训练和测试阶段目标不一致的问题。（剩余5182字）

试读结束

购买全文4.00元下一篇新型地理信息系统技术在工程测绘中的应用要点分析

科技资讯

2024年15期

¥12.00/本