基于数据增强和扩张卷积的ICD编码分类

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要:针对ICD编码分类任务存在的标签分布不平衡、临床记录文本过长和标签空间庞大等问题,提出一种基于数据增强和扩张卷积的ICD编码分类方法。首先,引入预训练模型BioLinkBERT,在生物医学领域采用无监督学习方式进行训练,以缓解域不匹配问题;其次,运用Mixup数据增强技术扩充隐藏表示,从而增加数据多样性及提升模型分类的鲁棒性,解决标签分布不平衡问题;最后,利用多粒度扩张卷积有效捕获文本数据中的长距离依赖关系,避免因输入文本过长影响模型效果。(剩余25682字)

目录
monitor