语料库驱动的通用汉语学术词表构建

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要:学术词表开发是学术汉语研究的重要课题。该研究基于1450篇学术期刊论文构建了汉语学术语料库,借鉴英语学术词表AWL和AVL的创建方法,开发了一个包含1368个词型的通用汉语学术词表,并对该词表的有效性进行了检验。检验结果表明:通用汉语学术词表覆盖了汉语学术语料库25.88%的文本,覆盖水平较高;词表在BCC和LCMC语料库的学术、科技子库的覆盖率分别为18.85%和23.86%,在文学库和微博库的覆盖率低于3%,这一差异表明词表中的学术词汇具有一定代表性;词表对汉语学术语料库各子库的覆盖率均超过17%,能较好地服务于不同学科领域的学术汉语教学和学习。(剩余13680字)

monitor