9

我使用 numexpr 对大型数组进行快速数学运算,但如果数组的大小小于 CPU 缓存,则使用简单的数组数学在 Cython 中编写我的代码要快得多,尤其是在多次调用该函数的情况下。

问题是,你如何在 Cython 中使用数组,或者更明确地说:Cython 中是否有 Python 的 array.array 类型的直接接口?我想做的是这样的(简单的例子)

cpdef array[double] running_sum(array[double] arr):
    cdef int i 
    cdef int n = len(arr)
    cdef array[double] out = new_array_zeros(1.0, n)
    ... # some error checks
    out[0] = arr[0]
    for i in xrange(1,n-1):
        out[i] = out[i-1] + arr[i]

    return(out)

我首先尝试使用 Cython numpy 包装器并使用 ndarrays,但与使用 malloc 创建 C 数组相比,创建它们似乎对于小型 1D 数组非常昂贵(但内存处理变得很痛苦)。

谢谢!

4

1 回答 1

5

您可以使用基本功能滚动您自己的简单功能,并检查这里是一个模型开始:

from libc.stdlib cimport malloc,free

cpdef class SimpleArray:
    cdef double * handle
    cdef public int length
    def __init__(SimpleArray self, int n):
        self.handle = <double*>malloc(n * sizeof(double))
        self.length = n
    def __getitem__(self, int idx):
        if idx < self.length:
            return self.handle[idx]
        raise ValueError("Invalid Idx")
    def __dealloc__(SimpleArray self):
        free(self.handle) 

cpdef SimpleArray running_sum(SimpleArray arr):
    cdef int i 
    cdef SimpleArray out = SimpleArray(arr.length)

    out.handle[0] = arr.handle[0]
    for i from 1 < i < arr.length-1:
        out.handle[i] = out.handle[i-1] + arr.handle[i]
    return out

可以用作

>>> import test
>>> simple = test.SimpleArray(100)
>>> del simple
>>> test.running_sum(test.SimpleArray(100))
<test.SimpleArray object at 0x1002a90b0>
于 2011-03-30T17:37:18.580 回答