假设我们有一个 C 函数,它接受一组一个或多个输入数组,处理它们,并将其输出写入一组输出数组。签名如下(count
表示要处理的数组元素的数量):
void compute (int count, float** input, float** output)
我想通过 ctypes 从 Python 调用此函数,并使用它将转换应用于一组 NumPy 数组。对于定义为的单输入/单输出函数
void compute (int count, float* input, float* output)
以下作品:
import ctypes
import numpy
from numpy.ctypeslib import ndpointer
lib = ctypes.cdll.LoadLibrary('./block.so')
fun = lib.compute
fun.restype = None
fun.argtypes = [ctypes.c_int,
ndpointer(ctypes.c_float),
ndpointer(ctypes.c_float)]
data = numpy.ones(1000).astype(numpy.float32)
output = numpy.zeros(1000).astype(numpy.float32)
fun(1000, data, output)
但是,我不知道如何为多个输入(和/或输出)创建相应的指针数组。有任何想法吗?
编辑:所以人们一直想知道如何compute
知道预期有多少数组指针(count
指每个数组的元素数)。事实上,这是硬编码的;一个给定的compute
准确地知道有多少输入和输出。调用者的工作是验证这一点input
并output
指出正确数量的输入和输出。这是一个compute
采用 2 个输入并写入 1 个输出数组的示例:
virtual void compute (int count, float** input, float** output) {
float* input0 = input[0];
float* input1 = input[1];
float* output0 = output[0];
for (int i=0; i<count; i++) {
float fTemp0 = (float)input1[i];
fRec0[0] = ((0.09090909090909091f * fTemp0) + (0.9090909090909091f * fRec0[1]));
float fTemp1 = (float)input0[i];
fRec1[0] = ((0.09090909090909091f * fTemp1) + (0.9090909090909091f * fRec1[1]));
output0[i] = (float)((fTemp0 * fRec1[0]) - (fTemp1 * fRec0[0]));
// post processing
fRec1[1] = fRec1[0];
fRec0[1] = fRec0[0];
}
}
我无法影响compute
. 我可以验证(来自 Python!)需要多少输入和输出。关键问题是如何argtypes
为函数提供正确的,以及如何在 NumPy 中生成适当的数据结构(指向 NumPy 数组的指针数组)。