numpy - c 风格的联合与 numpy dtypes？

Question

我对使用有些不均匀数据类型的 numpy 数组很感兴趣。由于 numpy 指定数据必须是同质的，这将通过定义一个充当所有子 dtype 的联合包装器的 super-dtype 来实现。访问子 dtypes 的字段然后给出对基础数据的不同解释。

例如，已经有一些设施可以做到这一点

dtype(('|S2', [('x', '|i1'), ('y', '|i1')]))

指的是一个双字节字符串的数组，但第一个和第二个字节也可以通过'x'和'y'字段名称解释为整数。不过，我不知道如何将字段标签分配给两字节字符串。

这可以更通用，以便我们可以在数据上覆盖任意数量的不同字段规范吗？

我的第一次尝试是在 dtype 中指定字段偏移量，但失败并抱怨必须对偏移量进行排序（即非重叠数据）。

dtype1 = np.dtype(dict(
   names=['a','b'], 
   formats=['|a2','<i2'], 
   offsets=[0,0]))

另一种技术有效，但很麻烦。在这种技术中，我可以将多个变量定义为相同基础数据的视图，并更改不同变量的 dtype 以让我以不同格式访问数据，即

a=np.zeros(3, dtype='<a2')
b=a[:]
b.dtype='<i2'

这让我可以根据我查看的是 a 还是 b，以字符串或整数的形式访问数据。但这是一种操作数据的繁琐方式。理想情况下，我希望能够指定具有任意偏移量的各种不同字段。有没有办法做到这一点？

score 5 · Accepted Answer

自 2011 年 6 月起允许使用 Union dtypes：https ://github.com/numpy/numpy/pull/94

您需要升级到 NumPy 1.7.x 才能使用它。

但是，在以前的版本中，您可以使用覆盖 dtype 构造函数：

>>> a = np.zeros(3, dtype=np.dtype(('<i2', [('a', '|a2')])))
>>> a[0] = 0x3456
>>> a['a'][0]
'V4'

1 回答 1