我正在使用 Apriori 算法一段时间,我在问我关于频繁项集候选生成的步骤。
如果我想将两个频繁的 3 项集连接到一个(候选)4 项集中,则连接项集中必须有 2 项相同而另一项不同。
例如我可以加入
{Married: Yes, Age:20, Cars:1} and {Married: Yes, Age:20, Unemployed: No}
至
{Married: Yes, Age:20, Cars:1, Unemployed: No}
但有时我在 Apriori 算法中读到了这一步:
我可以加入两个频率。来自 L_{k-1} 的项目,当有按字典顺序排列的前 k-2 个项目相同且最后一个项目不同时。
但是当我从上面的词典排序我的项目集时,第一个 k-2 项目不会相同,所以我可能不会加入它们?!?
{Age:20, Cars:1, Married: Yes} and {Age:20, Married: Yes Unemployed: No}
我希望我能清楚地向你解释我的问题!
谢谢你的帮助!!