4

我正在寻找广义序列模式算法 (GSP) http://en.wikipedia.org/wiki/GSP_Algorithm的示例实现

虽然 Wikipedia 文章提供了伪代码,但它有点令人困惑,我希望看到一些正确的代码(最好是 python 或 java)。有谁知道一个好的参考?

我想首先了解该算法,然后可能使其在 MapReduce 世界中工作 - 正如维基百科文章显示的那样,我认为计数器的使用可能很复杂。

我这样做是因为我有一个事件图,其中边缘受时间限制,一个序列将是一个节点连接到另一个节点的位置,其中 A -> B 在开始和结束时间之间发生并且 B -> C 发生B 完成第一次连接后 X 次。A -> B -> C 将是序列,序列不能多次重新访问节点。

4

2 回答 2

1

SPMF 是一个很好的工具,它实现了许多算法。它可以帮助我们节省大量时间。但是我们需要比较不同算法的性能,比如广义序列模式(GSP),这是序列模式挖掘中的一个重要算法。

于 2013-03-14T11:00:10.917 回答
1

如果您想要一些用于GSP、PrefixSpan、SPADE、SPAM和许多其他的 Java 代码,请查看此网站:http ://www.philippe-fournier-viger.com/spmf/

然后您可以检查是否可以将它们调整为 map-reduce 算法。

于 2012-04-26T04:08:51.583 回答