0

假设我有两个时间戳系列事件:

T1 = ['2017-03-22 15:16:45', '2017-03-22 15:16:50', '2017-03-22 15:17:55', ...]
T2 = ['2017-03-22 15:16:47', '2017-03-22 15:16:52', '2017-03-22 15:17:57', ...]

每个时间戳表示它发生的时间。

他们可能看起来像

我们可以看出,T2 只是 T1 的时移,所以它们属于同一模式。相似度应为 100%。

它们也可能看起来像

这里的相似度应该是 50%。

我读过一篇论文说我们可以应用 LSH(Locality-Sensitive Hashing)来检测相似性。但我不知道如何详细做到这一点。任何想法?

4

0 回答 0