3

下面的代码与http://docs.python.org/2/library/queue.html上的 python 官方 Queue 示例几乎相同

from Queue import Queue
from threading import Thread
from time import time
import sys

num_worker_threads = int(sys.argv[1])
source = xrange(10000)

def do_work(item):
    for i in xrange(100000):
        pass

def worker():
    while True:
        item = q.get()
        do_work(item)
        q.task_done()

q = Queue()

for item in source:
    q.put(item)

start = time()

for i in range(num_worker_threads):
    t = Thread(target=worker)
    t.daemon = True
    t.start()

q.join()

end = time()

print(end - start)

以下是 Xeon 12 核处理器上的结果:

$ ./speed.py 1
12.0873839855

$ ./speed.py 2
15.9101941586

$ ./speed.py 4
27.5713479519

我预计增加工作人员的数量会减少响应时间,但相反,它正在增加。我一次又一次地做实验,但结果没有改变。

我错过了一些明显的东西吗?或者 python 队列/线程不能很好地工作?

4

2 回答 2

18

是的,Maxim 关于 GIL 的说法是正确的。但是一旦你在工人身上做了一些值得做的事情,大多数情况下情况就会发生变化。线程中要做的典型事情包括等待 I/O 或其他可以很好地完成线程切换的事情。如果您不只是计算工人的数字,而是模拟睡眠工作,情况就会发生巨大变化:

#!/usr/bin/env python

from Queue import Queue
from threading import Thread
from time import time, sleep
import sys

num_worker_threads = int(sys.argv[1])
source = xrange(1000)

def do_work(item):
    for i in xrange(10):
        sleep(0.001)

def worker():
    while True:
        item = q.get()
        do_work(item)
        q.task_done()

q = Queue()

for item in source:
    q.put(item)

start = time()

for i in range(num_worker_threads):
    t = Thread(target=worker)
    t.daemon = True
    t.start()

q.join()

end = time()

这给出了以下结果:

for i in 1 2 3 4 5 6 7 8 9 10; do echo -n "$i "; ./t.py $i; done
1 11.0209097862
2 5.50820493698
3 3.65133094788
4 2.73591113091
5 2.19623804092
6 1.83647704124
7 1.57275605202
8 1.38150596619
9 1.23809313774
10 1.1111137867

在此处输入图像描述

于 2013-05-21T09:33:27.313 回答
9

Python在多线程方面相当差。由于全局锁,一次只有一个线程通常会取得进展。见http://wiki.python.org/moin/GlobalInterpreterLock

于 2013-05-21T08:40:12.407 回答