0

我有N个大小为m的向量v。我可以像这样计算两个向量之间的相关性:

d = correlation(v1,v2)

我想为每个向量 v1 找到一个相关值高于 0.9 的对向量 v2。我无法计算相关矩阵,因为我有大量向量( N > 3 百万)。
朴素的算法如下所示:

for v1 in vectors: 
  for v2 in vectors:
     if correlation(v1,v2) > 0.9:
        yield (v1,v2)
        break

你有更好的算法建议吗?我认为我可以使用启发式算法来做到这一点,因为我不想要最大相关值,而只想要相关性在阈值之间的其他值。

4

0 回答 0