面向新闻专题的事件脉络持续跟踪构建方法

打开文本图片集
摘要:通过构建新闻专题的事件脉络,可以辅助读者识别事件演化发展阶段,把控事件的全局性信息。随着专题事件的演化发展,相关新闻会持续不断出现对事件进行报道。为了保障事件脉络的完整性和时效性,需要从最新新闻数据流中追踪相关新闻,对事件脉络进行持续跟踪更新。提出了一种面向新闻的专题事件脉络持续跟踪构建方法,采用K-means聚类和基于凝聚式的层次聚类方法检测事件发展阶段,构建以时间为主线、各发展阶段为分支的事件发展演化脉络,保障事件脉络的完整性和连续性;综合实体、关键词和文本3个维度的相似度特征从新闻数据流中持续跟踪与专题事件相关的新闻数据,将追踪到的新闻事件同时更新到事件文本向量和已构建的事件脉络中,实现对事件脉络的持续跟踪构建。(剩余9709字)