再次更新
我试图创建一些简单的方法来重现这一点,但没有成功。
到目前为止,我已经尝试了各种简单的数组分配和操作,但它们都抛出 MemoryError 而不仅仅是 SIGKILL 崩溃。
例如:
x =np.asarray(range(999999999))
或者:
x = np.empty([100,100,100,100,7])
只需按照应有的方式抛出 MemoryErrors 即可。
我希望在某个时候有一种简单的方法来重新创建它。
结束更新
我有一个运行 numpy/scipy 和一些自定义 C 扩展的 python 脚本。
在我的 Virtual Box 下的 Ubuntu 14.04 上,它运行得很好。
在 Amazon EC2 T2 微型实例上,它会终止(运行一段时间后)并输出:
被杀
在python调试器下运行,信号未被捕获,调试器也退出。
在 strace 下运行,我得到:
munmap(0x7fa5b7fa6000, 67112960) = 0
mmap(NULL, 67112960, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7fa5b7fa6000
mmap(NULL, 67112960, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7fa5affa4000
mmap(NULL, 67112960, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7fa5abfa3000
mmap(NULL, 67637248, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7fa5a7f22000
mmap(NULL, 67637248, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7fa5a3ea1000
mmap(NULL, 67637248, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7fa59fe20000
gettimeofday({1406518336, 306209}, NULL) = 0
gettimeofday({1406518336, 580022}, NULL) = 0
+++ killed by SIGKILL +++
在尝试捕获“SIGKILL”时在 gdb 下运行,我得到:
[Thread 0x7fffe7148700 (LWP 28022) exited]
Program terminated with signal SIGKILL, Killed.
The program no longer exists.
(gdb) where
No stack.
运行 python 的跟踪模块(python -m trace --trace ),我得到:
defmatrix.py(292): if (isinstance(obj, matrix) and obj._getitem): return
defmatrix.py(293): ndim = self.ndim
defmatrix.py(294): if (ndim == 2):
defmatrix.py(295): return
defmatrix.py(336): return out
--- modulename: linalg, funcname: norm
linalg.py(2052): x = asarray(x)
--- modulename: numeric, funcname: asarray
numeric.py(460): return array(a, dtype, copy=False, order=order)
我现在想不出其他任何事情来弄清楚发生了什么。
我怀疑它可能内存不足(它是一个 AWS Micro 实例),但我不知道如何确认或否认这一点。
有没有我可以使用的另一种工具来帮助精确定位程序停止的位置?(或者我正在以错误的方式运行上述工具之一来解决这个问题?)
更新
Amazon EC2 T2 微实例默认没有定义交换空间,所以我添加了一个 4GB 的交换文件并且能够运行程序完成。
但是,我仍然对运行程序的方式非常感兴趣,这样它会以一些更接近“内存不足”而不是“已杀死”的消息而终止
如果有人有任何建议,他们将不胜感激。