0

我已经澄清并简化了这个问题:

我的数据如下所示:

011100111110100111
111111111111110010
111100001111000011

数据流的一维通道。每一行都表示存在 1 或 0 的类型。类型往往以块的形式存在于流中。行的垂直顺序无关紧要。

我正在寻找维度在两个或多个索引处重合的模式,无论是在'1' group's 的开头,还是任何 '1' groups在所有行/维度上重叠的地方。

如果保持其比例,则图案可以与附近的相邻索引偏移。

D = 维度/行 N = 流中的索引

((D1(N), D25(N+4), D900(N-1)), (3, 67, 90, 3000))

可能在多个位置发生的模式匹配示例。N 处的 Dimension01,索引 N + 4 处的 Dimension25,索引 N -1 处的 Dimension900 出现在索引 3、67、90 和 3000 处。

返回的模式:

  • 按匹配索引的数量或模式中的维数排序。
  • 在至少两个点上匹配至少两个维度

我该怎么办?

4

1 回答 1

0

据我了解,频繁项集挖掘的方法可能是您正在寻找的。作为起点,我将研究著名的Apriori算法,这是在您的示例中检测常见的“1”元素块的最基本技术之一(假设我们可以将每一列解释为一个独立的维度,并且没有维度之间的特定语义/关系,这将修改问题,因为维度的顺序变得有意义)。

于 2014-01-23T15:18:43.223 回答