我有一个项目集列表{A_i}->{X}
。
喜欢:
{A}->{X}
{A}->{Z}
{A,B}->{X}
{A,B}->{W}
现在我想合并项目集,如:
{A}->{X,Z}
{A,B}->{X,W}
但我不知道如何计算每条规则的支持、信心和提升。
这是总和/计数还是所有类似项目集的最小值?
对于支持,所有类似集合的最小支持都是有意义的。但是信心和提升?
我认为您指的是关联规则。
对于关联规则 X--> Y,该规则的支持表示为 sup(X-> Y) 并且是 XUY 出现的事务数除以事务总数。
置信度是 XUY 出现的事务数除以 X 出现的事务数。
提升定义为:lift(X-->Y) = ( (sup(XUY)/ N) / (sup(X)/ N*sup(Y)/ N ),其中 N 是事务数据库,sup(X∪Y)是包含X和Y的事务数,sup(X)是包含X的事务数sup(Y)是包含Y的事务数。
举升力计算的例子可以查看SPMF软件的例子23:
http://www.philippe-fournier-viger.com/spmf/index.php?link=documentation.php#lift