2
rules <- apriori(table2, parameter = list(minlen=1, sup=s))
itemsets <- unique(generatingItemsets(rules))
itemsets.df <- as(itemsets, "data.frame")
F <- as.matrix(itemsets.df[with(itemsets.df, order(-support,items)),])

输出:

# items            support
"{a,b}"              "1.0"  
"{a}"                "1.0"  
"{b}"                "1.0"  
"{c,a,b}"            "0.5"  
"{c,a}"              "0.5"  
"{c,b}"              "0.5"  
"{a,b,d}"            "0.5"  
"{a,d}"              "0.5"  
"{b,d}"              "0.5"

使用 apriori 和 generateItemsets 获取频繁事件集,如“items”所示。但在这种情况下,我只想要输出中的超集,即“{c,a,b}”和“{a,b,d}”。我该怎么做才能仅在 R 中获得超集?

4

2 回答 2

2

如果对项集进行排序(并删除大括号),则要删除的集是下一个集的前缀。

# Sample data
library(arules)
example(apriori)
itemsets <- unique(generatingItemsets(rules))
itemsets.df <- as(itemsets, "data.frame")
F <- as.matrix(itemsets.df[with(itemsets.df, order(-support,items)),])

library(stringr) 
x <- as.character(F[,1])
x <- sort( str_replace_all( x, "[{}]", "" ) )
x
i <- seq_len( length(x) - 1 )
to_remove <- str_detect(x[i+1], paste0("^", x[i]))
x[ ! to_remove ]
于 2013-07-09T12:34:23.997 回答
1

我知道这是一个较老的问题,但它是 google 关于 apriori 规则超集的第一个热门问题,我研究了很长时间,然后使用 arules 包中的 is.maximal 函数找到了一个非常简单的解决方案。

因此,对于手头的问题,在您生成规则之后,使用 is.maxim 将它们子集:

rules <- apriori(table2, parameter = list(minlen=1, sup=s))
maximal_rules <- rules[is.maximal(rules)]

然后,如果您愿意,您可以只获取唯一的项目集:

itemsets <- unique(generatingItemsets(maximal_rules))

这是使用文森特回答中的示例数据的可重现示例:

library(arules)
example(apriori)
inspect(rules)
maximal_rules<-rules[is.maximal(rules)]
inspect(maximal_rules)
itemsets <- unique(generatingItemsets(maximal_rules))
inspect(itemsets)
于 2016-04-15T15:21:05.123 回答