12

这会产生一个Segmentation Fault: 11,我不知道为什么。

在我开始之前,这是代码:

import numpy.random as nprnd
import heapq
import sys

sys.setrecursionlimit(10**6)


def rlist(size, limit_low, limit_high):
    for _ in xrange(size): 
        yield nprnd.randint(limit_low, limit_high)

def iterator_mergesort(iterator, size):
    return heapq.merge(
         iterator_mergesort(
           (iterator.__next__ for _ in xrange(size/2)), size/2),
         iterator_mergesort(
            iterator, size - (size/2))
       )

def test():
    size = 10**3
    randomiterator = rlist(size, 0, size)
    sortediterator = iterator_mergesort(randomiterator, size)
    assert sortediterator == sorted(randomiterator)

if __name__ == '__main__':
    test()

基本上,它只是一种合并排序,它适用于迭代器和生成器表达式,而不是适用于列表,以便在任何时候最小化内存占用。没什么特别的,它使用 heapq.merge() 内置方法来合并迭代器,所以当一切都中断时我很惊讶。

快速运行代码会给出Segmentation Fault: 11一个错误窗口,告诉我 python 已崩溃。我不知道在哪里看或如何调试这个,所以任何帮助将不胜感激。

4

1 回答 1

10

Segmentation Faults在 python 中发生有两个原因之一:

你内存不足

C 模块中的错误

在这里,seg 故障属于第一个。你(我)有一个无限的递归,因为在 iterator_mergesort() 中没有基本情况,它会一直不断地调用自己。

通常,python 会为此抛出异常,它会在导致段错误之前终止。但是,递归限制已设置得非常高,因此 python 在识别出它应该为无限递归抛出异常之前耗尽内存并中断。

添加一个基本案例,如下所示:

...
def iterator_mergesort(iterator, size):
return heapq.merge(
         iterator_mergesort(
           (iterator.next() for _ in xrange(size/2)), size/2),
         iterator_mergesort(
            iterator, size - (size/2))
       ) if size >= 2 else iterator #<-- Specifically this

现在它通过了 test() 函数并进行了排序,尽管速度很慢。

于 2013-10-02T00:26:13.727 回答