0

FP-growth 算法用于项集挖掘。有没有办法将这些算法用于顺序模式挖掘而不是项集挖掘?

4

1 回答 1

0

FPGrowth 算法被定义为用于在事务上查找项集。因此,它不关心项目的顺序,每个项目在一个事务中只能出现一次。

如果您想将其应用于序列以查找序列模式,那么这是一个更普遍的问题。换句话说,项集挖掘是顺序模式挖掘的一个特例。要处理这个问题,您需要泛化 FPGrowth。首先,您需要修改 FPTree 以存储项目可以多次出现的序列。这意味着更改树的分支的创建方式。但是您还需要更改节点表示项目之间的链接的处理方式,因为同一项目可以在每个序列中出现多次。

但这真的是个好主意吗?我不确定。有许多顺序模式挖掘算法。例如,您可以在我的 SPMF 数据挖掘库 ( http://www.philippe-fournier-viger.com/spmf/ ) 中使用 Java 实现的几个实现,因此您不需要自己实现。

于 2018-08-15T14:37:25.440 回答