基于内容和上下文的敏感个人信息实体识别方法

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要:针对现有方法对非结构文本中结构复杂的敏感个人信息实体无法有效识别的问题,提出一种基于内容和上下文的敏感个人信息实体识别方法。一方面,利用规则匹配检测具有可预测模式的敏感实体类型;另一方面,构建了一个基于词对关系分类架构(ELECTRA-W2NER,EW2NER)的实体关系分类识别模型,以检测模式复杂的敏感实体类型。(剩余8382字)

monitor