假设我有一个事件列表。例如A, D, T, H, U, A, B, F, H, ...
.
我需要的是找到完整序列中出现的频繁模式。在这个问题中,我们不能使用像先验或 fp 增长这样的传统算法,因为它们需要单独的项目集。而且,我不能把这个流分成更小的集合。
知道哪种算法对我有用吗?
编辑
例如,对于序列A, D, T, H, U, A, D, T, H, T, H, U, A, H, T, H
和 with min_support = 2
。
频繁模式将是
Of length 1 --> [A, D, T, H, U]
Of length 2 --> [AD, DT, TH, HU, UA, HT]
Of length 3 --> [ADT, DTH, THU, HUA]
Of length 4 --> [ADTH, THUA]
No sequences of length 5 and further