当给出支持度和置信度的百分比值时,如何在 Apriori 算法中找到最小支持度。例如,当支持度和置信度分别为 60% 和 60% 时,最小支持度是多少?
6 回答
支持度和置信度是衡量规则有趣程度的指标。
最小支持度和最小置信度由用户设置,是关联规则生成的 Apriori 算法的参数。这些参数用于排除结果中支持度或置信度分别低于最小支持度和最小置信度的规则。
所以回答你的问题,当你说:“例如,当支持和信心分别为 60% 和 60% 时,最小支持是多少?” 您可能的意思是您已将最低支持和置信度设置为 60 %。
我认为您只是对这些条款感到困惑。
我的回答来得太晚了,但我猜 Chanikag 的问题是 - “当支持阈值为 60% 时,如何最小化支持计数”。最小支持计数将是事务计数,因此它将是事务总数的 60%。如果事务数为 5,则您的最小支持计数为 5*60/100 = 3。
在此处查看带有实时可用示例的 Apriori 算法的完整说明:
http://www.coded.com/articles/apriori-algorithm
您可以添加新项目并输入最小支持阈值和最小置信度阈值,然后在演示 Silverlight 小部件中立即查看生成的大型项目集。
最小支持计数是所有交易的百分比。假设您有 60% 的支持计数,5 是总交易,那么 min_support 的数量将是 5*60/100=3。
我不确定你的问题是否有意义。从您的示例中,如果您返回了至少一条支持和置信度为 60% 的规则,您可以确定最低支持度至少为 60%,但可能更多。
Minimum-Support 是提供给 Apriori 算法的参数,以便通过指定生成的关联规则的 Support 度量的最小下限来修剪候选规则。还有一个相应的最小置信度修剪参数。
算法产生的每条规则都有自己的支持度和置信度度量。粗略地说,支持率是所有实例中规则为真的实例的比率。置信度是规则为真的实例与前件(蕴涵的 LHS)为真的实例数量的比率。
查看维基百科以获得更严格的定义。
您必须使用最小支持计数来比较候选人的支持计数。如果您将最小支持计数指定为“%”值,则必须首先找到事务数并执行以下操作。
例如,您的数据库中有 10 个事务。
minimum support count is 70%. Now, to get the number as Min. Sup.count = number of transactions * (minimum support count% / 100)
So, min.sup.count= 10 * 70/100
Answer is 7.
This is how you have to calculate min.sup.count