4

我试图弄清楚如何逐列遍历 scipy 稀疏矩阵。我正在尝试计算每列的总和,然后按该总和对该列的成员进行加权。我想做的基本上是:

for i=0 to #columns
  for j=0 to #rows
    sum=sum+matrix[i,j]
  for j=0to #rows
    matrix[i,j]=matrix[i,j]/sum

我在示例中看到的所有迭代器都一次迭代整个矩阵,而不是按列进行。有没有办法做我想做的事?

4

1 回答 1

3

Scipy 稀疏矩阵有自己的sum方法可以用于此。例如:

A=sp.lil_matrix((5,5))
b=1+np.arange(0,5)
A.setdiag(b[:-1],k=1)
A.setdiag(b)


print(A)
  (0, 0)        1.0
  (0, 1)        1.0
  (1, 1)        2.0
  (1, 2)        2.0
  (2, 2)        3.0
  (2, 3)        3.0
  (3, 3)        4.0
  (3, 4)        4.0
  (4, 4)        5.0

f=A.sum(axis=0)

print(f)   
[[1. 3. 5. 7. 9.]]

返回的总和是密集的numpy.matrix,您可以将其转换为比例因子:

print(A/f)
[[1.         0.33333333 0.         0.         0.        ]
 [0.         0.66666667 0.4        0.         0.        ]
 [0.         0.         0.6        0.42857143 0.        ]
 [0.         0.         0.         0.57142857 0.44444444]
 [0.         0.         0.         0.         0.55555556]]
于 2012-05-07T08:33:03.527 回答