2

我想查看一个包含整个行的 dtype 的对象数组:

data = np.array([['a', '1'], ['a', 'z'], ['b', 'a']], dtype=object)
dt = np.dtype([('x', object), ('y', object)])
data.view(dt)

我收到一个错误:

TypeError: Cannot change data-type for object array.

我尝试了以下解决方法:

dt2 = np.dtype([('x', np.object, 2)])
data.view()
data.view(np.uint8).view(dt)
data.view(np.void).view(dt)

所有情况都会导致相同的错误。有什么方法可以查看具有不同 dtype 的对象数组吗?

我还尝试了一种更通用的方法(仅供参考,因为它在功能上与上面显示的相同):

dt = np.dtype(','.join(data.dtype.char * data.shape[1]))
dt2 = np.dtype([('x', data.dtype, data.shape[1])])
4

1 回答 1

2

似乎您总是可以使用以下命令强制查看缓冲区np.array

view = np.array(data, dtype=dt, copy=not data.flags['C_CONTIGUOUS'])

虽然这是一种快速而肮脏的方法,但在这种情况下,数据会被复制,并且dt2无法正确应用:

>>> print(view.base)
None
>>> np.array(data, dtype=dt2, copy=not data.flags['C_CONTIGUOUS'])
array([[(['a', 'a'],), (['1', '1'],)],
       [(['a', 'a'],), (['z', 'z'],)],
       [(['b', 'b'],), (['a', 'a'],)]], dtype=[('x', 'O', (2,))])

对于更正确的方法(在某些情况下),您可以使用原始np.ndarray构造函数:

real_view = np.ndarray(data.shape[:1], dtype=dt2, buffer=data)

这样可以真实地查看数据:

>>> real_view
array([(['a', '1'],), (['a', 'z'],), (['b', 'a'],)], dtype=[('x', 'O', (2,))])
>>> real_view.base is data
True

如图所示,这仅在数据具有 C 连续行时才有效。

于 2020-10-05T14:40:17.040 回答