1

我正在使用mlxtend查找关联规则:

这是代码:

df = apriori(dum_data, min_support=0.4, use_colnames=True)
rules = association_rules(df, metric="lift", min_threshold=1)
rules2=rules[ (rules['lift'] >= 1) & (rules['confidence'] >= 0.7) ]

输出:

antecedents             consequents    antecedentsupport    consequentsupport   support confidence  lift      leverage  conviction
frozenset({'C'})        frozenset({'B'})        0.63        0.705                   0.45    0.726   1.030       0.013   1.077
frozenset({'A'})        frozenset({'B'})        0.98        0.705                   0.69    0.70    1.003       0.0007  1.00081
frozenset({'A', 'C'})   frozenset({'B'})        0.63        0.705                   0.45    0.72    1.030       0.013   1.0776

我给了一个min support=0.4. antecedentsupportconsequentsupport和有什么区别support

lift and leverage?如何判断它的好坏是什么意思?

信心我可以理解这是输出中第一条规则一起发生的次数C和次数。B? 那是对的吗

4

1 回答 1

3

让我们以第三条规则({A,C} => {B})为例:

支持 = 支持 {A, B, C} | 支持意味着,您计算包含 {A, B, C} 的所有三个的事务数并将其除以事务总数。

antecedentsupport = 支持 => 之前的内容,表示支持 {A,C}

consequentsupport = 支持 => 之后的内容,表示支持 {B}

置信度 = 在我们观察到 {A,C} 之后,交易还包含 {B} 的可能性有多大。将其视为条件概率 p(B 给定 {A,C})。

电梯:电梯的定义可以在这里找到:维基百科。这意味着,如果提升 < 1 比 {A,C} 和 {B} 一起出现的频率低于预期。如果提升大于 1,则 {A,C} 和 {B} 一起出现的频率比预期的要高。

杠杆大致相同。它还比较了预期的共现和观察到的共现。进一步的解释,例如这里

好的提升/杠杆作用是主观的,但我建议提升 > 1。如果涉及到规则,我会更多地关注信心。

于 2020-06-21T19:59:05.867 回答