2004, 17(3): 385-389.
摘要:
为了提高数据挖掘效率,提出了一种基于图的频繁闭项集挖掘算法GFCG(graph-based frequent closed
itemset generation).该算法采用位矢量技术构造有向图,表示项与项之间的频繁关系,并在有向图的基础上递归
产生频繁闭项集,从而只需扫描数据库2次,不产生候选集;引入扩展频繁项集的概念,大大减小了检查频繁项
集是否闭的搜索空间.用1个真实数据库和2个合成数据库对GFCG进行了测试,并与A-close和CLOSET算法
的结果进行了比较,结果表明,该算法具有良好的速度和可伸缩性性能.