嘿,伙计们,我正在尝试在 vertica db 中实现关联规则挖掘:到目前为止,我通过查找频繁项集完成了繁重的工作,但是我仍然需要生成规则。这是一个例子:
初始表:
+--------+-------+-------+
| item1 | item2 | item3 |
+--------+-------+-------+
| A | B | C |
+--------+-------+-------+
使用 3 个项目,我可以生成 6 个规则,一个规则有一个规则体和一个规则头。这将导致下表:
+---------+---------+--------+--------+
| ItemB1 | ItemB2 | ItemH1 | ItemH2 |
+---------+---------+--------+--------+
| A | Null | B | C |
| B | Null | A | C |
| C | Null | A | B |
| A | B | C | Null |
| A | C | B | Null |
| B | C | A | Null |
+---------+---------+--------+--------+
这是一个非常抽象的例子,实际上有不止一个项目集,一个项目集中有超过 3 个项目。我发现了一些讨论关联规则挖掘的论文,并声称这部分是微不足道的。猜猜对我来说不是那么微不足道。
谢谢