8

我已经实现了一个多处理下载器。如何打印可以在终端的不同部分自动刷新的状态栏(完成率,下载速度)。

像这样:

    499712  [6.79%]   68k/s     // keep refreshing
    122712  [16.79%]   42k/s    // different process/thread
     99712  [56.32%]   10k/s

代码:

download(...)
...
    f = open(tmp_file_path, 'wb')
    print "Downloading: %s Bytes: %s" % (self.file_name, self.file_size)
    file_size_dl = 0
    block_sz = 8192
    start_time = time.time()
    while True:
        buffer = self.opening.read(block_sz)
        if not buffer:
            break

        file_size_dl += len(buffer)
        f.write(buffer)
        end_time = time.time()
        cost_time = end_time - start_time
        if cost_time == 0:
            cost_time = 1
        status = "\r%10d  [%3.2f%%]  %3dk/s" % (file_size_dl,
                file_size_dl * 100. / self.file_size,
                file_size_dl * 100. / 1024 / 1024 / cost_time)
        print status,
        sys.stdout.flush()
    f.close()

DownloadProcess 继承 Process 类并触发下载方法。

我使用队列来存储网址。这是启动过程

  ...
  for i in range(3):
    t = DownloadProcess(queue)
    t.start()
    for url in urls:
        queue.put(url)
  queue.join()
4

1 回答 1

23

下面是一个同时实现了多处理和多线程的演示。要尝试其中一个,只需取消注释代码顶部的导入行。如果您在一行上有一个进度条,那么您可以使用打印 '\r' 的技术将光标移回行首。但是,如果您想要多行进度条,那么您将不得不变得更花哨。每次我想打印进度条时,我都会清空屏幕。查看文章Python 中的 Unix 上的控制台输出,它对我生成下面的代码有很大帮助。他展示了这两种技术。您还可以试一试作为 python 标准库一部分的 curses 库。问题多行进度条问了一个类似的问题。主线程/进程产生子线程来完成工作并使用队列将它们的进度传回主线程。我强烈建议使用队列进行进程间/线程通信。然后主线程显示进度并等待所有子线程结束执行,然后再退出。

代码

import time, random, sys, collections
from multiprocessing import Process as Task, Queue
#from threading import Thread as Task
#from Queue import Queue

def download(status, filename):
    count = random.randint(5, 30)
    for i in range(count):
        status.put([filename, (i+1.0)/count])
        time.sleep(0.1)

def print_progress(progress):
    sys.stdout.write('\033[2J\033[H') #clear screen
    for filename, percent in progress.items():
        bar = ('=' * int(percent * 20)).ljust(20)
        percent = int(percent * 100)
        sys.stdout.write("%s [%s] %s%%\n" % (filename, bar, percent))
    sys.stdout.flush()

def main():
    status = Queue()
    progress = collections.OrderedDict()
    workers = []
    for filename in ['test1.txt', 'test2.txt', 'test3.txt']:
        child = Task(target=download, args=(status, filename))
        child.start()
        workers.append(child)
        progress[filename] = 0.0
    while any(i.is_alive() for i in workers):
        time.sleep(0.1)
        while not status.empty():
            filename, percent = status.get()
            progress[filename] = percent
            print_progress(progress)
    print 'all downloads complete'

main()

演示

在此处输入图像描述

于 2012-12-19T06:41:18.640 回答