我遇到了一些问题,需要一些帮助。我有一段代码,用于嵌入 python 脚本。这个 python 脚本包含一个函数,它期望接收一个数组作为参数(在这种情况下,我在 python 脚本中使用 numpy 数组)。我想知道如何将一个数组从 C 传递到嵌入式 python 脚本作为脚本中函数的参数。更具体地说,有人可以给我看一个简单的例子。
2 回答
真的,这里最好的答案可能是只使用numpy
数组,即使是从你的 C 代码中。但如果这不可能,那么您将遇到与在 C 类型和 Python 类型之间共享数据的任何代码相同的问题。
一般来说,在 C 和 Python 之间共享数据至少有五个选项:
- 创建
list
要传递的 Python 或其他对象。 - 定义一个新的 Python 类型(在您的 C 代码中)来包装和表示数组,使用您在 Python 中为序列对象定义的相同方法(
__getitem__
等)。 - 将指向数组的指针转换为
intptr_t
,或显式ctypes
类型,或者不进行转换;然后ctypes
在 Python 端使用来访问它。 - 将指向数组的指针转换为
const char *
并将其作为 astr
(或,在 Py3 中,bytes
)传递,并在 Python 端使用struct
orctypes
来访问它。 - 创建一个与
buffer
协议匹配的对象,然后在 Python 端再次使用struct
orctypes
。
在您的情况下,您想numpy.array
在 Python 中使用 s 。因此,一般情况变为:
- 创建一个
numpy.array
通过。 - (可能不合适)
- 将指针按原样传递给数组,并从 Python 中用于
ctypes
将其numpy
转换为可以转换为数组的类型。 - 将指向数组的指针转换
const char *
为 astr
(或者,在 Py3 中,bytes
),它已经是numpy
可以转换为数组的类型。 - 创建一个与
buffer
协议匹配的对象,我相信numpy
它可以直接转换。
对于 1,这里是如何用 a 来做的list
,只是因为它是一个非常简单的例子(而且我已经写过了……):
PyObject *makelist(int array[], size_t size) {
PyObject *l = PyList_New(size);
for (size_t i = 0; i != size; ++i) {
PyList_SET_ITEM(l, i, PyInt_FromLong(array[i]));
}
return l;
}
这是numpy.array
等效的(假设您可以依赖 Carray
不被删除 - 请参阅在文档中创建数组以获取有关您的选项的更多详细信息):
PyObject *makearray(int array[], size_t size) {
npy_int dim = size;
return PyArray_SimpleNewFromData(1, &dim, (void *)array);
}
无论如何,无论如何你这样做,你最终会得到一个看起来像PyObject *
来自 C 的东西(并且有一个引用计数),所以你可以将它作为函数参数传递,而在 Python 端它看起来像一个numpy.array
, list
, bytes
, 或其他任何合适的。
现在,您实际上如何传递函数参数?好吧,您在评论中引用的Pure Embedding中的示例代码显示了如何执行此操作,但并没有真正解释发生了什么。实际上,扩展文档中的解释比嵌入文档要多,特别是Calling Python Functions from C。另外,请记住,标准库源代码充满了这样的示例(尽管其中一些不是因为优化,或者只是因为它们没有被更新以利用新的简化 C API 功能)。
跳过关于从 Python 获取 Python 函数的第一个示例,因为大概您已经拥有了。第二个示例(以及与之相关的段落)显示了一种简单的方法:使用Py_BuildValue
. 所以,假设我们想调用一个你已经存储在上面的函数返回myfunc
的列表的函数。这是你要做的:mylist
makelist
if (!PyCallable_Check(myfunc)) {
PyErr_SetString(PyExc_TypeError, "function is not callable?!");
return NULL;
}
PyObject *arglist = Py_BuildValue("(o)", mylist);
PyObject *result = PyObject_CallObject(myfunc, arglist);
Py_DECREF(arglist);
return result;
当然,如果你确定你有一个有效的可调用对象,你可以跳过可调用检查。(如果合适的话,通常最好在第一次得到 时检查myfunc
,因为这样可以提供更早和更好的错误反馈。)
如果您想真正了解发生了什么,请尝试不使用Py_BuildValue
. 正如文档所说, to 的第二个参数[PyObject_CallObject][6]
是一个元组,PyObject_CallObject(callable_object, args)
相当于apply(callable_object, args)
,相当于callable_object(*args)
. 所以,如果你想myfunc(mylist)
在 Python 中调用,你必须有效地将它转换成 C,myfunc(*(mylist,))
这样你就可以将它翻译成 C。你可以tuple
像这样构造一个:
PyObject *arglist = PyTuple_Pack(1, mylist);
但通常,Py_BuildValue
它更容易(特别是如果您还没有将所有内容打包为 Python 对象),并且代码中的意图更清晰(就像使用PyArg_ParseTuple
比tuple
在另一个方向使用显式函数更简单和清晰一样)。
那么,你是怎么得到的myfunc
呢?好吧,如果您已经从嵌入代码创建了函数,只需保留指针即可。如果您希望它从 Python 代码中传递,这正是第一个示例所做的。例如,如果您想从模块或其他上下文中按名称查找它,具体类型PyModule
和抽象类型的 APIPyMapping
非常简单,如何将 Python 代码转换为等效的 C 代码通常很明显,即使结果大多是丑陋的样板。
综上所述,假设我有一个 C 整数数组,我想import mymodule
调用一个mymodule.myfunc(mylist)
返回 int 的函数。这是一个精简的示例(未经实际测试,也没有错误处理,但它应该显示所有部分):
int callModuleFunc(int array[], size_t size) {
PyObject *mymodule = PyImport_ImportModule("mymodule");
PyObject *myfunc = PyObject_GetAttrString(mymodule, "myfunc");
PyObject *mylist = PyList_New(size);
for (size_t i = 0; i != size; ++i) {
PyList_SET_ITEM(l, i, PyInt_FromLong(array[i]));
}
PyObject *arglist = Py_BuildValue("(o)", mylist);
PyObject *result = PyObject_CallObject(myfunc, arglist);
int retval = (int)PyInt_AsLong(result);
Py_DECREF(result);
Py_DECREF(arglist);
Py_DECREF(mylist);
Py_DECREF(myfunc);
Py_DECREF(mymodule);
return retval;
}
如果您使用的是 C++,您可能想研究某种范围守卫/看门人/等。处理所有这些Py_DECREF
调用,尤其是当您开始进行正确的错误处理时(这通常意味着return NULL
通过函数进行的早期调用)。如果您使用的是 C++11 或 Boost,unique_ptr<PyObject, Py_DecRef>
可能就是您所需要的。
但实际上,如果您打算进行大量 C<->Python 通信,那么减少所有丑陋样板的更好方法是查看所有为改进 Python 扩展而设计的熟悉框架——<a href="http: //www.cython.org" rel="noreferrer">Cython、boost::python等。即使您正在嵌入,您实际上也在做与扩展相同的工作,因此它们可以以相同的方式提供帮助。
就此而言,如果您搜索文档,其中一些还具有帮助嵌入部分的工具。例如,您可以使用 Cython 编写主程序,同时使用 C 代码和 Python 代码,以及cython --embed
. 您可能想要交叉手指和/或牺牲一些鸡,但如果它有效,它会非常简单和富有成效。Boost 的开始并不是那么简单,但是一旦你把所有的东西放在一起,几乎所有的事情都会按照你期望的方式完成,并且可以正常工作,对于嵌入和扩展来说都是如此。等等。
Python 函数需要传入一个 Python 对象。由于您希望该 Python 对象是一个 NumPy 数组,因此您应该使用其中一个NumPy C-API 函数来创建数组;PyArray_SimpleNewFromData()
可能是一个好的开始。它将使用提供的缓冲区,而不复制数据。
也就是说,用 Python 编写主程序并为 C 代码使用 C 扩展模块几乎总是更容易。这种方法可以更轻松地让 Python 进行内存管理,并且该ctypes
模块与 Numpy 的cpython
扩展一起可以轻松地将 NumPy 数组传递给 C 函数。