我想创建一个小的 NumPy 整数来节省内存。但是,我注意到
import numpy,sys
print sys.getsizeof(numpy.int8(1))
prints 12
,所以它似乎numpy.int8()
生成了 12 个字节而不是 1 个字节的数据。为什么是这样?
Numpy 标量具有与 CPython 数据类型类似的实现,例如 python 浮点或整数类型。换句话说,它是一个包含三个变量的结构:
类型的引用计数器int
指向其对象类型实例的指针
变量的值
在 32 位架构中,引用计数器和指针通常各为 4 个字节。value 字段原则上可以是任意大小,但结构填充将导致结构分配 4 个字节,即使 value 需要更少。
如果您正在使用 64 位架构,请将“4 字节”替换为“8 字节”。
因此,32 位系统上的所有 numpy 整数都由(有效地)三个 4 字节变量组成,并sys.getsizeof(numpy.int8(1))
给出 12。在 64 位系统上,它将返回 24。
大多数 numpy 标量的大小相同。一个例外是numpy.complex
类型,它通常需要双重存储。由于这在内存中与其他两个变量对齐,因此您可以忽略填充并简单地将分配给该值的字节加倍,分别在 32 位和 64 位中给出 16 和 32 字节。类似的规则适用于更奇特的类型(complex256
,float80
等)