基于隐性句逗号识别的汉语长句机器翻译

  • 打印
  • 收藏
收藏成功


打开文本图片集

提 要:长句翻译一直是机器翻译的难题。本文根据汉语中相当数量的逗号和句号可相互转化的特点,提出“隐性句号”和“隐性逗号”概念,并实现其自动识别,以将汉语长句变为短句用于汉英机器翻译。为此,首先通过人工与半监督学习结合方法构建一个隐性句逗数据集,实现基于预训练模型的隐性句逗识别方法,其中性能最好的Hierarchical BERT作为后续应用模型。(剩余17546字)

monitor