3

为什么 math.factorial 在线程中表现得如此奇怪?

这是一个示例,它创建了三个线程:

  • 只休眠一段时间的线程
  • 增加 int 一段时间的线程
  • 对大量数执行 math.factorial 的线程。

它调用start线程,然后join超时

sleep 和 spin 线程按预期工作并start立即返回,然后join等待超时。

另一方面,阶乘线程start直到运行到最后才返回!

import sys
from threading import Thread
from time import sleep, time
from math import factorial

# Helper class that stores a start time to compare to
class timed_thread(Thread):
    def __init__(self, time_start):
        Thread.__init__(self)
        self.time_start = time_start

# Thread that just executes sleep()
class sleep_thread(timed_thread):
    def run(self):
        sleep(15)
        print "st DONE:\t%f" % (time() - time_start)

# Thread that increments a number for a while       
class spin_thread(timed_thread):
    def run(self):
        x = 1
        while x < 120000000:
            x += 1
        print "sp DONE:\t%f" % (time() - time_start)

# Thread that calls math.factorial with a large number
class factorial_thread(timed_thread):
    def run(self):
        factorial(50000)
        print "ft DONE:\t%f" % (time() - time_start)

# the tests

print
print "sleep_thread test"
time_start = time()

st = sleep_thread(time_start)
st.start()
print "st.start:\t%f" % (time() - time_start)
st.join(2)
print "st.join:\t%f" % (time() - time_start)
print "sleep alive:\t%r" % st.isAlive()


print
print "spin_thread test"
time_start = time()

sp = spin_thread(time_start)
sp.start()
print "sp.start:\t%f" % (time() - time_start)
sp.join(2)
print "sp.join:\t%f" % (time() - time_start)
print "sp alive:\t%r" % sp.isAlive()

print
print "factorial_thread test"
time_start = time()

ft = factorial_thread(time_start)
ft.start()
print "ft.start:\t%f" % (time() - time_start)
ft.join(2)
print "ft.join:\t%f" % (time() - time_start)
print "ft alive:\t%r" % ft.isAlive()

这是 CentOS x64 上 Python 2.6.5 的输出:

sleep_thread test
st.start:       0.000675
st.join:        2.006963
sleep alive:    True

spin_thread test
sp.start:       0.000595
sp.join:        2.010066
sp alive:       True

factorial_thread test
ft DONE:        4.475453
ft.start:       4.475589
ft.join:        4.475615
ft alive:       False
st DONE:        10.994519
sp DONE:        12.054668

我已经在 CentOS x64 上的 python 2.6.5 和 Windows x86 上的 2.7.2 上尝试过这个,并且阶乘线程不会从其中任何一个上的开始返回,直到线程完成执行。

我也在 Windows x86 上使用 PyPy 1.8.0 进行了尝试,结果略有不同。开始确实会立即返回,但是连接不会超时!

sleep_thread test
st.start:       0.001000
st.join:        2.001000
sleep alive:    True

spin_thread test
sp.start:       0.000000
sp DONE:        0.197000
sp.join:        0.236000
sp alive:       False

factorial_thread test
ft.start:       0.032000
ft DONE:        9.011000
ft.join:        9.012000
ft alive:       False
st DONE:        12.763000

也尝试过 IronPython 2.7.1,它产生了预期的结果。

sleep_thread test
st.start:       0.023003
st.join:        2.028122
sleep alive:    True

spin_thread test
sp.start:       0.003014
sp.join:        2.003128
sp alive:       True

factorial_thread test
ft.start:       0.002991
ft.join:        2.004105
ft alive:       True
ft DONE:        5.199295
sp DONE:        5.734322
st DONE:        10.998619
4

2 回答 2

5

由于Global Interpreter Lock,线程通常只允许在 Python 中交错不同的事情,而不是同时发生不同的事情。

如果您查看 Python 字节码:

from math import factorial

def fac_test(x):
    factorial(x)

import dis
dis.dis(fac_test)

你得到:

  4           0 LOAD_GLOBAL              0 (factorial)
              3 LOAD_FAST                0 (x)
              6 CALL_FUNCTION            1
              9 POP_TOP             
             10 LOAD_CONST               0 (None)
             13 RETURN_VALUE        

如您所见,调用math.factorial是 Python 字节码级别的单个6 CALL_FUNCTION操作factorial( Python 在运行时不会切换到其他线程,并且您会得到观察到的结果。

于 2012-03-21T22:32:35.267 回答
2

Python 有一个全局解释器锁 (GIL),它要求 CPU 绑定的线程轮流运行,而不是同时运行。由于阶乘函数是用 C 编写的并且不释放 GIL,因此即使设置sys.setswitchinterval也不足以让线程协作。

multiprocessing模块提供 Process 对象,这些对象类似于线程,但工作在不同的地址空间中。对于 CPU 密集型任务,您应该强烈考虑使用该multiprocessing模块。

于 2012-03-21T22:34:56.740 回答