面向在线健康社区UGC的医疗健康知识图谱构建研究

——以小儿腹泻病为例

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要:构建面向在线健康社区用户生成内容(User Generated Content,UGC)数据的医疗健康知识图谱,探究基于用户潜在需求的健康知识抽取,对优化在线健康社区信息组织与检索,支撑在线健康社区知识服务创新具有重要意义。提出基于在线健康社区UGC数据的实体识别组合模型LDA-BERT-BiLSTM-CRF,首先利用LDA主题模型对在线健康社区UGC数据进行主题聚类分析从而提取实体类型,基于细分实体类型利用BERTBiLSTM-CRF模型进行命名实体识别;然后采用MC-BERT-CasRel模型抽取在线健康社区UGC数据中的重叠三元组,并通过SBERT模型实现实体对齐;最后利用Neo4j图数据库完成知识图谱的存储和可视化。(剩余14472字)

monitor