1

我试图在不复制的情况下将 2D ndarray 视为记录或结构化数组。a如果拥有它的数据,这似乎工作正常

>>> a = np.array([[  1, 391,  14,  26],
              [ 17, 371,  15,  30],
              [641, 340,   4,   7]])
>>> b = a.view(zip('abcd',[a.dtype]*4))
array([[(1, 391, 14, 26)],
       [(17, 371, 15, 30)],
       [(641, 340, 4, 7)]], 
      dtype=[('a', '<i8'), ('b', '<i8'), ('c', '<i8'), ('d', '<i8')])
>>> b.base is a
True

但如果a已经是一个视图,则失败。这是一个例子

>>> b = a[:,[0,2,1,3]]
>>> b.base is None
False
>>> b.view(zip('abcd',[a.dtype]*4))
ValueError: new type not compatible with array.

有趣的是,在这种情况下b.base是视图的转置

>>> (b.base == b.T).all()
True

因此,numpy 无法创建我想要的视图是有道理的。

但是,如果我使用

>>> b = np.take(a,[0,2,1,3],axis=1)

这导致b成为数据的正确副本,以便采用recarray 视图。附带问题:有人可以用花哨的索引来解释这种行为吗?

我的问题是,我是不是走错了路?不支持以我的方式进行查看吗?如果是这样,那么正确的方法是什么?

4

1 回答 1

1

(大编辑)

bF_CONTINGUOUS(见b.flags)。然后视图中的字段数需要匹配 的行数b,而不是列数:

In [204]: b=a[:,[0,2,1,3]].view('i4,i4,i4')
In [205]: b
Out[205]: 
array([[(0, 4, 8), (2, 6, 10), (1, 5, 9), (3, 7, 11)]], 
      dtype=[('f0', '<i4'), ('f1', '<i4'), ('f2', '<i4')])

一个更简单的情况是a.copy(order='F').view('i4,i4,i4')

np.take(a,[0,2,1,3],axis=1)a[:,[0,2,1,3]].copy()生成C_CONTIGUOUS副本,因此可以使用 4 个字段进行查看。

还要注意b.base有 3 列。


(早些时候在这个问题上磕磕绊绊)

成为一个观点不是问题。

 a = np.arange(12).reshape(3,4)
 a.view('i4,i4,i4,i4')

做得很好。

制作第一个副本b也可以:

 b=a[:,[0,2,1,3]].copy()
 b.view('i4,i4,i4,i4')

第一个b(没有副本)是F_CONTIGUOUS(看b.flags)。这就是你b.base == b.T所展示的。

np.take产生与此相同类型的数组b copy- 即相同的标志和相同的__array_interface__显示。

其他有效的东西:

a[[0,2,1],:].view('i4,i4,i4,i4')
a.T[[0,2,1,3],:].T.view('i4,i4,i4,i4')

如果我用纯数组索引替换混合切片和数组索引:

a[[[0],[1],[2]],[0,2,1,3]].view('i4,i4,i4,i4')

结果是C_CONTIGUOUS。所以有些细节[:, [...]]我没有解释——特别是为什么它会产生一个F_CONTIGUOUS副本。

混合的基本/高级索引文档部分确实警告内存布局可能会改变:

http://docs.scipy.org/doc/numpy/reference/arrays.indexing.html#combining-advanced-and-basic-indexing

在最简单的情况下,只有一个高级索引。例如,单个高级索引可以替换切片,结果数组将是相同的,但是,它是一个副本,并且可能具有不同的内存布局。如果可能,切片是优选的。

于 2015-08-22T20:53:00.257 回答