如果性能是关键,我会使用 numpy(或 scipy)对其进行矢量化。
>>> import numpy
>>> L1 = [47, 92, 65, 25, 44, 8, 74, 42, 48, 56, 74, 5, 60, 84, 88, 16, 69, 87, 9, 82, 69, 82, 40, 49, 1, 45, 93, 70, 22, 40, 97, 49, 95, 34, 28, 91, 79, 9, 32, 91, 41, 22, 36, 2, 57, 69, 81, 73, 7, 71]
>>> arr = numpy.array(L1)
>>> count_of_num_greater_than_10 = numpy.sum(arr > 10)
>>> num_greater_than_10 <= 2
False
当然,它不会短路,所以如果你很早就有两个错误的陈述,它会计算其余的。
计时结果。
简单的计时测试,使用从 1 到 100 的数字填充的随机 1000 个元素列表进行 1000 次迭代(在启动计时器之前完成数组创建的设置),显示矢量化方法快 100 倍以上。
>>> import timeit
>>> timeit.timeit('sum([n>10 for n in L1])>=2',
setup='import numpy; L1=list(numpy.random.randint(1,100,1000))',
number=1000)
2.539483070373535
>>> timeit.timeit('numpy.sum(L1>10)>=2',
setup='import numpy; L1=numpy.random.randint(1,100,1000)',
number=1000)
0.01939105987548828
如果您想要失败的成员,那并不难;您可以通过以下方式找到不大于 10 的数字:
>>> list(arr[numpy.where(arr<10)])
[8, 5, 9, 1, 9, 2, 7]
同样,矢量化版本比非矢量化版本快几个数量级:
>>> timeit.timeit('[i for i in L1 if i < 10]',
setup='import numpy; L1=list(numpy.random.randint(1,100,1000))',
number=1000)
0.4471170902252197
>>> timeit.timeit('L1[numpy.where(L1<10)]',
setup='import numpy; L1=numpy.random.randint(1,100,1000)',
number=1000)
0.011003971099853516