基于Apriori算法与MapReduce优化模型的并行式数据聚类方法

打开文本图片集
摘要:针对Apriori算法产生大量无效候选集的问题,为提升MapReduce模型下Apriori算法挖掘关联规则的性能,提出崭新的并行式数据聚类方法:基于W-DPC策略设计Apriori候选项集结合方法,预先确定MapReduce模型框架下Apriori算法执行的passes量,reduce无需等待map任务执行完毕再开始工作,降低passes阶段的运行负载;通过引入二项频繁集快速生成策略,明显降低Apriori算法生成二项频繁集的时间复杂度。(剩余4848字)