1

这个问题https://math.stackexchange.com/questions/338646/sort-vectors-according-to-their-distance-between-them是关于基于它们之间的距离对向量进行排序。如何根据向量之间的相关系数对向量进行排序。我想做的是根据向量在数据集中的“重要性”对向量进行排序。如果我们有 N 个向量,那么排序将是 V1,V2,...,Vn,其中 V1 和 Vn 的相关性低于其他向量。V1 和 V2 彼此之间最相关......等等。我正在考虑使用皮尔逊系数作为相关系数。这可能吗?或者您对这个问题有任何想法吗?是否有一个好的算法可以做到这一点,或者我们应该找到每对向量之间的相关系数,然后找到两个相关性较低的向量,然后对两个相关性较低的向量之间的所有向量进行排序。

谢谢阅读和回答:)

4

1 回答 1

0

皮尔森会工作。通常的点积、Manhattan 等也会如此。

当然,您意识到这需要一个matrix

向量 1 与自身完全相关,因此其值为 1.0。(想象一下在矩阵的对角线上。)然后下一个值 (1, 2) 显示向量 1 如何与向量 2 相关,依此类推到 (1, n)。

矩阵是对称的,因为 (i, j) = (j, i)。

对于n向量,nxn需要计算相关性。

于 2013-03-24T17:03:47.200 回答