1

我一直在寻找一种方法来创建最终对称的自定义 h5py 数组。理想情况下,它将是一个数组,这样当它被创建时有一个单一的值a[i][j]a[j][i]指向。这样做的原因是我会将一个大距离向量写入一个方形矩阵。向量和方阵太大而无法保存在内存中,所以我想要一个相对快速的解决方案来创建方阵。

4

1 回答 1

1

我建议使用一些额外的逻辑来执行此操作,使用一维数组来存储矩阵的上三角形。将 1D 数组中的索引映射到 2D 数组中,如下所示:

[[0  1  2  3 ]
 [x  4  5  6 ]
 [x  x  7  8 ]
 [x  x  x  9 ]]

您可以为此编写一个函数:

from __future__ import division
def tri_ravel_factory(n_cols):
    def tri_ravel(j, k):
        assert j < n_cols, 'j out of range'
        assert k < n_cols, 'j out of range'
        assert j >= 0, 'j out of range'
        assert k >= 0, 'j out of range'        
        if k < j:
            j, k = k, j
        #return sum(n_cols - tmp for tmp in range(0, j)) + (k - j)
        return j * n_cols - (j * (j-1))//2 + (k-j)
    return tri_ravel


test_ravel = tri_ravel_factory(4)
indx = test_ravel(1, 0)    

这只会让你变成两倍。使用稀疏数组可能会更好,即时计算所需的距离,或者找到一种不必计算大部分距离的方法(例如,如果您只关心与 配对distance < r)。

于 2013-05-27T15:15:57.280 回答