• 打印
  • 收藏
收藏成功
分享

基于Electra语言模型的地理命名实体识别


打开文本图片集

摘要:地理命名实体识别是构建高质量地理知识图谱的关键环节,需要从大量的非结构化文本中提取地理实体名称,为了提高识别效率和自动化水平,文章选取百度百科和中文地址要素解析任务的部分数据构建语料库,采用轻量化语言模型Electra与CRF相结合对唐山市地区的地理命名实体进行了自动识别研究。研究表明:Electra-CRF语言模型有很好的鲁棒性,以唐山市百度百科词条为例进行模型评估,该方法对于地理命名实体的平均解析准确率达80%以上,可以运用在构建地理知识图谱或者地理知识库的命名实体识别任务当中。(剩余4097字)

网站仅支持在线阅读(不支持PDF下载),如需保存文章,可以选择【打印】保存。

目录
monitor