频繁子图挖掘算法算法思路算法的思路比较简单,但是对于包含较多图的输入集合来说执行效率非常低,主要是因为挖掘算法在生成候选子图时要判断是否存在相同的k-1子图,当川尺大时,这需要花费很长时间
并且通过每次添加一个顶点来产生候选子图时会产生许多冗余k+l子图
在剪枝的过程中,也需要很多时间来判断每个k+l候选子图的所有k子图是否都是频繁的
剪枝后的候选子图仍然很多,因此需要大量的重复扫描输入图集合来计算候选子图的支持度
这就占用了大量的内存空间和CPU处理时间,很难发现较大的模式子图,执行效率不高
而频繁子图挖掘算法是在挖掘算法算法的基础上提出来的
区别在于频繁子图挖掘算法旨在发现连通的频繁子图,采用了一些特殊的技巧以提高性能
它引入了半连通图的概念,图G是半连通图当且仅当G是连通图或G只由一个连通分支和一个孤立点组成
在频繁子图挖掘算法中所使用的规范化标记将顶点的标号也考虑在内,同时还应用了诸如规范化标记发现和砂树等技巧来提高其性能
Kuramochi.M等人提出的FSG算法采用完全不同的找寻方法挖掘频繁子图
在他们的算法中采取每次添加一条边的策略,而不是每次添加一个顶点,并加强了候选子图的剪枝,在计算候选子图的支持度时采用TID列表帮助加速计算,使得执行效率较挖掘算法有所提高
以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。