TCN-Transformer-CTC的端到端语音识别

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要:基于Transformer的端到端语音识别系统获得广泛的普及,但Transformer中的多头自注意力机制对输入序列的位置信息不敏感,同时它灵活的对齐方式在面对带噪语音时泛化性能较差。针对以上问题,首先提出使用时序卷积神经网络(TCN)来加强神经网络模型对位置信息的捕捉,其次在上述基础上融合连接时序分类(CTC),提出TCN-Transformer-CTC模型。(剩余16540字)

目录
monitor
客服机器人