我正在开发一个用 cython 编写的 python 扩展模块,它包装了我编写的 C++ 类。
迷恋;撞车;崩溃
我有一个简单的 python 代码,可以导入这个 python 模块并用它处理一些数据。现在,大约 4 次中的 1 次,程序在终止之前,在调用模块之后出现段错误。这也意味着所有数据都得到了正确处理。它的段错误是这样的:
/Users/axe/anaconda/bin/python.app: line 2: 73168 Segmentation fault: 11
用 gdb 调试,运行gdb python
然后run code.py
,我得到
Program received signal EXC_BAD_ACCESS, Could not access memory.
Reason: 13 at address: 0x0000000000000000
0x00000001000894ae in PyObject_ClearWeakRefs ()
的输出backtrace
是
#0 0x00000001000894ae in PyObject_ClearWeakRefs ()
#1 0x00000001010edae4 in array_dealloc ()
#2 0x000000010007503e in tupledealloc ()
#3 0x00000001000559b7 in insertdict_by_entry ()
#4 0x0000000100059177 in PyDict_SetItem ()
#5 0x000000010005d286 in _PyModule_Clear ()
#6 0x00000001000df8cd in PyImport_Cleanup ()
#7 0x00000001000f0027 in Py_Finalize ()
#8 0x0000000100107e1b in Py_Main ()
#9 0x0000000100000f54 in start ()
所以段错误发生在我的python代码之外。我提到如果我从 ipython 中运行代码,或者将解释器/ipython 更改为 Enthought 发行版中的那个,或者如果我将 Cython 从 1.9.1 降级到 1.6,问题仍然存在。
C ++中的内存泄漏(?)
由于这看起来像是 C++ 代码中的内存泄漏(如果有其他可能的解释,请告诉我),我在 C++ 类的一些 C++ 测试代码上运行了 Valgrind,但没有发现任何问题。(我不是 100% 确定它没有问题,因为我在 OSX Mountain Lion 上,尽管使用了最新的主干版本 Valgrind,但已知它有问题。我使用的是 OSX10.8 抑制文件,带有这里建议的一个作为开始)。无论如何,C++ 类不使用 new/delete/malloc/free,所以应该没问题。
Cython 中的内存泄漏(?)
我尝试在崩溃的 python 代码上运行 valgrind。除了上面提到的 OSX 抑制文件之外,我还添加了一个 python 抑制文件。Valgrind 产生大量输出然后崩溃。在输出中没有对我的源代码的任何引用。这是有罪的 cython 代码:
def split_props(np.ndarray[fptype, ndim=1, mode="c"] x,
np.ndarray[fptype, ndim=1, mode="c"] y,
np.ndarray[fptype, ndim=1, mode="c"] ylines):
cdef np.ndarray[fptype, ndim = 1, mode = "c"] areas = np.zeros((ylines.shape[0] + 1), dtype=np.float64, order="c")
cdef np.ndarray[fptype, ndim = 1, mode = "c"] static_moments_x = np.zeros((ylines.shape[0] + 1), dtype=np.float64, order="c")
cdef np.ndarray[fptype, ndim = 1, mode = "c"] inertia_moments_xx = np.zeros((ylines.shape[0] + 1), dtype=np.float64, order="c")
cdef SplitPolygon * SPINSTANCE = new SplitPolygon(100, 100)
SPINSTANCE.split_props(& x[0], # = <fptype *> x.data
& y[0],
x.shape[0],
& ylines[0],
ylines.shape[0],
& areas[0],
& static_moments_x[0],
& inertia_moments_xx[0]
)
del SPINSTANCE
return areas, static_moments_x, inertia_moments_xx
上面,C++ 类是 SplitPolygon。在python代码中,我从cython模块中只导入了split_props
上面的函数,所以内存泄漏肯定在这部分代码或者C++代码中。此外,python 代码的功能与 C++ 测试代码相同。
我在下面还报告了模块的另一部分,非常相似,但不会导致任何内存泄漏
def SplitCirc(np.ndarray[fptype, ndim=1, mode="c"] ycenters,
np.ndarray[fptype, ndim=1, mode="c"] radii,
np.ndarray[fptype, ndim=1, mode="c"] ylines):
cdef np.ndarray[fptype, ndim = 1, mode = "c"] areas = np.zeros((len(ylines) + 1), dtype=np.float64, order="c")
cdef np.ndarray[fptype, ndim = 1, mode = "c"] static_moments_x = np.zeros((len(ylines) + 1), dtype=np.float64, order="c")
cdef np.ndarray[fptype, ndim = 1, mode = "c"] inertia_moments_xx = np.zeros((len(ylines) + 1), dtype=np.float64, order="c")
split_circles(& ycenters[0], & radii[0], len(ycenters),
& ylines[0], len(ylines),
& areas[0], & static_moments_x[0], & inertia_moments_xx[0])
return areas, static_moments_x, inertia_moments_xx
现在,我真的被困在了这一点上。你觉得 cython 代码好看吗?是否有任何测试用例我可以编写代码来检查 C++ 类 SplitPolygon 是否真的没有泄漏?崩溃是否会因其他原因而发生?