我正在寻找广义序列模式算法 (GSP) http://en.wikipedia.org/wiki/GSP_Algorithm的示例实现
虽然 Wikipedia 文章提供了伪代码,但它有点令人困惑,我希望看到一些正确的代码(最好是 python 或 java)。有谁知道一个好的参考?
我想首先了解该算法,然后可能使其在 MapReduce 世界中工作 - 正如维基百科文章显示的那样,我认为计数器的使用可能很复杂。
我这样做是因为我有一个事件图,其中边缘受时间限制,一个序列将是一个节点连接到另一个节点的位置,其中 A -> B 在开始和结束时间之间发生并且 B -> C 发生B 完成第一次连接后 X 次。A -> B -> C 将是序列,序列不能多次重新访问节点。