• 打印
  • 收藏
收藏成功
分享

混合信息双数组的未登录词动态识别模型


打开文本图片集

摘要:未登录词是影响命名实体识别效果的重要因素,现有分词工具在处理未登录词时不仅识别效果欠佳,且存在识别时间較长等问题。为提高分词效果,在现有分词器基础上结合未登录词识别模型,提出了一种基于改进双数组Trie的混合信息未登录词动态识别模型MIDAT,将双数组Trie扩展为字符双数组与概率双数组,利用字符双数组存储字符串词段信息,概率双数组存储字符串节点间的成词概率信息,通过不断识别未登录词,动态更新两个双数组Trie。(剩余11824字)

网站仅支持在线阅读(不支持PDF下载),如需保存文章,可以选择【打印】保存。

目录
monitor