基于ESPnet的中文语音翻译实现

  • 打印
  • 收藏
收藏成功


打开文本图片集

作者简介:赵勇(1974— ),男,陕西高陵人,高级工程师,学士;研究方向:卫星通信。

摘要:当前,很多场合急需实现从语音翻译为文本的功能,如视频字幕制作、实时语译等。文章介绍了一种ESPnet语音识别框架架构,并基于ESPnet框架,训练得到最优模型,该架构模型能将语音识别过程扩展为网页在线识别,对目前主流语音识别框架进行对比试验并总结其优缺点。(剩余3818字)

目录
monitor