基于多维度熵值考察的常用字表构建

  • 打印
  • 收藏
收藏成功


打开文本图片集

[关键词] 常用字;常用字表;汉字效用;熵值法

[摘 要] 常用字除了字频这一外显特性外,还应当具有稳定性、较广的分布性、构词构字的能产性等特征。以往基于语料选取来考察汉字,无法对每个汉字不同维度的特征进行量化,最终仍主要通过字频来构建字表。文章基于2007—2021年《中国语言生活状况报告》语言大数据,对常用字的字频、稳定性、分布度、构词频、构字频等五个维度进行详细的数据考察与特征分析,使用熵值法建立汉字效用综合测度模型,构建多维度常用字表。(剩余16915字)

monitor