基于字符特征掩码的中文拼写检查方法研究

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要:中文拼写检查旨在纠正文本中的错别字,是自然语言处理中的一项重要任务,广泛应用于搜索优化等领域。早期方法依赖混淆集与人工规则,近年来的方法则利用预训练模型为字符选择符合语义的候选字。然而,这些方法未能充分考虑多音字的情况,对字符特征的应用也存在不足。文章对Soft-Masked BERT进行了改进,提出了一种基于字符特征掩码的中文拼写检查方法。(剩余12665字)

目录
monitor