基于增强数据生成的新闻文本实体识别

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要:近年来,预训练语言模型的出现极大地推动了新闻文本实体识别领域的发展。然而,高质量、大规模标注数据的匮乏仍然是制约模型性能提升的关键因素。文章针对此问题设计了一种增强数据生成框架,该框架基于预训练语言模型,利用关键词选择和动态遮盖的方法构建损坏文本,再通过文本重构和数据选择生成多样化且连贯的增强数据。(剩余7914字)

目录
monitor