面向分级阅读的分级词表研制

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要 文章采用计算机自动处理与人工审核相结合的方式,研制了汉语分级词表,分级词表共收录了14459个词语,划分为七个级别。基于大规模教材语料库、童书语料库与网页语料库制定了分级词表的选词规范,选择部分网络词语作为教材文本的补充;根据现有词典知识与汉语构词规则,利用计算机程序自动处理一些候选词语,请专家人工仔细审核部分词语;最后,将所构建的分级词表与义务教育词表、对外汉语词表进行了比较分析,初步验证了分级词表的质量。(剩余9538字)

monitor
客服机器人