7

在我的代码中,我通常使用 numpy 数组来连接方法和类。优化我的程序的核心部分,我将 cython 与这些 numpy 数组的 c 指针一起使用。不幸的是,我目前声明数组的方式很长。

例如,假设我有一个方法应该返回一个 numpy 数组 someArrayNumpy,但在函数指针内部 *someArrayPointers 应该用于提高速度。我通常是这样声明的:

cdef:
    numpy.ndarray someArrayNumpy = numpy.zeros(someArraySize)
    numpy.ndarray[numpy.double_t, ndim=1] someArrayBuff = someArrayNumpy
    double *someArrayPointers = <double *> someArrayBuff.data

[... some Code ...]

return someArrayNumpy

如您所见,这基本上占用了一个数组的 3 行代码,而且通常我必须声明更多这些数组。

有没有更紧凑/更聪明的方法来做到这一点?我想我错过了一些东西。

编辑:

所以因为它是由 J. Martinot-Lagarde 提出的,所以我对 C 指针和“numpy 指针”进行了计时。代码基本上是

for ii in range(someArraySize):
    someArrayPointers[ii] += 1

for ii in range(someArraySize):
    someArrayBuff[ii] += 1

使用上面的定义,但我添加了 "ndim=1, mode='c'" 只是为了确保。结果是 someArraySize = 1e8(以毫秒为单位的时间):

testMartinot("cPointers")
531.276941299
testMartinot("numpyPointers")
498.730182648

这就是我从以前/不同的基准中大致记得的内容。

4

1 回答 1

6

您实际上在这里声明了两个 numpy 数组,第一个是通用的,第二个具有特定的 dtype。你可以跳过第一行,someArrayBuff 是一个 ndarray。

这给出了:

numpy.ndarray[numpy.double_t] someArrayNumpy = numpy.zeros(someArraySize)
double *someArrayPointers = <double *> someArrayNumpy.data

您至少需要两行,因为您正在使用 someArrayPointers 并返回 someArrayNumpy,因此您必须声明它们。


作为旁注,如果您声明数组的类型和维数,您确定指针比 ndarrays 快吗?

numpy.ndarray[numpy.double_t, ndim=2] someArrayNumpy = numpy.zeros(someArraySize)
于 2013-07-10T13:57:15.613 回答