给定一组项集C
和一个支持阈值m
,是否有一种有效的方法来生成(或一个)最大频繁模式?
我所说的频繁模式是指一个项目集,其中的项目集的p
数量,例如的一个子集,至少是。通过最大模式,我的意思是项目的数量应该尽可能大。s
C
p
s
m
p
具体来说,我想避免生成所有“最大”或“封闭”模式的(组合大)集——任何最大尺寸的单一模式都可以。
给定一组项集C
和一个支持阈值m
,是否有一种有效的方法来生成(或一个)最大频繁模式?
我所说的频繁模式是指一个项目集,其中的项目集的p
数量,例如的一个子集,至少是。通过最大模式,我的意思是项目的数量应该尽可能大。s
C
p
s
m
p
具体来说,我想避免生成所有“最大”或“封闭”模式的(组合大)集——任何最大尺寸的单一模式都可以。
我发现了一系列有趣的工作,基于 FP-Tree 数据结构。该方法在2008 年的一篇不错的论文中进行了描述,并在 2011 年通过添加新的修剪技术进行了扩展。
构建一个 FPTree,并在构建树的同时,记录最长的树路径,使得 support >= minsup。
这会给你最大的项目集。
如果 minsup =0,那么最大的项目集是最大的交易。