基于松弛平方交叠率的分词词典无监督优选方法

  • 打印
  • 收藏
收藏成功


打开文本图片集

关键词:松弛平方交叠率,平方交叠率,分词词典,无监督优选,越南语

从自然语言文本到语汇(Token)序列的处理过程是传统自然语言处理和深度学习自然语言处理都需要的基础步骤.像缅甸语[1]、泰语[2]和老挝语[3]一样,越南语文本中词与词之间也没有明显的分隔符,但得到词序列往往是各种自然语言处理任务的(剩余5868字)

monitor