我有几个tables.carray
相同形状的大型数据结构(300000x300000)。我想添加所有数据并将其存储在主矩阵中。
现在,我创建了一个新的数组并用一个简单的循环填充它:
shape = (300000,300000)
#... open all hdf5 files of the existing matrices and create a new one
matrix = h5f.createCArray( h5f.root, 'carray', atom, shape, filters=filters )
for i in range( shape[0] ):
for j in range( shape[1] ):
for m in single_matrices:
# print 'reading', i,j,shape
value = m[i, j]
# print 'writing'
matrix[i, j] += value
但它非常慢(> 12 小时)。有没有更好的办法?