0

据我了解,Apriori 算法的工作原理是首先找到满足支持阈值的所有频繁项集,然后从也满足最小置信度的频繁项集中生成强关联规则。

因此,我希望在 R 包规则中:

txs <- as(inputDataTable,"transactions") itemsets <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="frequent itemsets")) rules <- ruleInduction(itemsets)

txs <- as(inputDataTable,"transactions") rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))

会导致相同的规则,但是在第二个示例中找到了更多规则,我不明白为什么。

谁能解释这是为什么?我现在正在努力解决它一段时间..

4

1 回答 1

0

好的..现在很简单,我知道问题出在哪里。

对于遇到类似问题的任何人。问题是(当然)应该在 ruleInduction() 步骤而不是在查找所有项集时设置置信度。只有支持才是相关的。因为我没有在 ruleInduction() 步骤中给出置信度值,所以使用了置信度的默认值 0.8,因此找到的规则更少。

这样做:

txs <- as(inputDataTable,"transactions") itemsets <- apriori(txs, parameter = list(support = 0.05, target="frequent itemsets")) rules <- ruleInduction(itemsets, confidence = 0.7)

txs <- as(inputDataTable,"transactions") rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))

会导致相同的结果。:)

于 2014-09-18T08:40:56.420 回答