更新算法算法描述

更新算法算法描述PFP-growth算法是公认的高效并行关联规则挖掘算法,该算法基于FP-growth算法,采用MapReduce编程模型,对FP-growth算法各个步骤进行并行化处理

在面对大量数据时,PFP-growth算法具有较高的准确性和伸缩性,解决了FP-growth算法单机情况下面对大量数据时性能不足的问题

但由于事务数据库处于不断更新中,PFP-growth算法仍然不能利用已有挖掘结果进行增量挖掘

主要是针对关联规则的增量更新问题,提出并行关联规则增量更新算法,该算法分为2个步骤: (1)针对原事务数据库DB进行分组,构建各映射数据库,利用MapReduce并行挖掘出频繁项集并保存,该步骤与PFP-growth算法类似;( 2) 针对新增数据库,利用之前的挖掘结果再次进行并行挖掘,完成频繁项集的更新

 

以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。

相关