基于Bert的中医方剂文本命名实体识别

打开文本图片集
摘要:针对中医药领域常用命名实体识别模型存在的边界模糊和歧义性等问题,本文提出基于大规模预处理中文语言模型(Bert)的中医方剂文本命名实体识别方法。通过Bert预训练模型接受其相对应的词向量,将预处理完成的词向量输入到长短期记忆(Bi-LSTM)模块中,完成对文本上下文语义信息的捕获,最后使用条件随机场(CRF)模块解码输出得到的预测标签排序,依次检索和排序各类中医方剂文本实体,从而完成整个实体识别步骤,结果显示出Bert对中医方剂各类实体识别具有较高的适用性,中医方剂各类实体识别的准确率得到显著提升。(剩余8619字)