7

我正在使用 numpy histogram2d 来计算两个变量的二维直方图的视觉表示值:

H, xedges, yedges = np.histogram2d(Z[:,0], Z[:,1], bins=100)

其中 Z 是一个 numpy 矩阵

我得到的错误是:

Traceback (most recent call last):
File "/home/.../pca_analysis.py", line 141, in <module>
   H, xedges, yedges = np.histogram2d(Z[:,0], Z[:,1], bins=100)
File "/usr/lib/python2.7/dist-packages/numpy/lib/twodim_base.py", line 615, in histogram2d
   hist, edges = histogramdd([x,y], bins, range, normed, weights)
File "/usr/lib/python2.7/dist-packages/numpy/lib/function_base.py", line 281, in histogramdd
   N, D = sample.shape
ValueError: too many values to unpack

我无法真正理解为什么会收到此错误。我尝试使用带有随机值的 histogram2d 函数,它工作正常。我还尝试在 numpy 数组和简单列表中转换 Z[:,0] 和 Z[:,1] ,但我遇到了同样的问题。

4

1 回答 1

6

正如@seberg 在评论中指出的那样,Z它是一个矩阵,因此在切片之前必须将其转换为数组。

np.asarray(Z)[:,0]

这是必要的原因是因为np.matrix即使在切片后仍保持其二维性,因此矩阵的列具有形状(N,1),而不是(N,)直方图函数所期望的。

切片后转换为数组不起作用的原因是形状通过转换没有改变;切片的行为是不同的。

如果这没有意义,这里有一个插图:

In [4]: a = np.arange(9).reshape(3,3)

In [5]: a
Out[5]: 
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [6]: m = np.matrix(a)

In [7]: m
Out[7]: 
matrix([[0, 1, 2],
        [3, 4, 5],
        [6, 7, 8]])

In [8]: m[:,0]
Out[8]: 
matrix([[0],
        [3],
        [6]])

In [9]: a[:,0]
Out[9]: array([0, 3, 6])

In [10]: m[:,0].shape
Out[10]: (3, 1)

In [11]: a[:,0].shape
Out[11]: (3,)

如果切片后进行投射,形状仍然是 2d:

In [12]: np.array(m[:,0])
Out[12]: 
array([[0],
       [3],
       [6]])

In [13]: np.array(m[:,0]).shape
Out[13]: (3, 1)
于 2013-09-27T17:04:27.310 回答