我想为 multiprocessing.Pool 中的子进程提供两个参数?我觉得我在上坡。是否有可能作为 2 个 args 或一个元组,或者...... 对于某些人来说,它似乎工作正常,正确地传递了两个文件名(输入和输出),但随后在变量点意外地出现了错误。遗憾的是,它并没有真正起作用,因为输出文件都是空的——如果我直接调用它,或者单独处理,这不会发生。还有另一个复杂的因素,被调用的例程在另一个导入的模块中。将其本地化为“foo”存根模块确实可以解决问题,但它只打印参数,而不是尝试做任何实际工作。
对于顽固地抵制学习如何使用队列来说,这可能是一个很长的路要走,但我只想确认我不会在我所走的道路上取得任何进展。
fixtures/txt_data/AAD.txt obj/txt_data/AAD.txt
fixtures/txt_data/ANZSMW.txt obj/txt_data/ANZSMW.txt
fixtures/txt_data/BENPA.txt obj/txt_data/BENPA.txt
fixtures/txt_data/CBAIZQ.txt obj/txt_data/CBAIZQ.txt
Traceback (most recent call last):
File "./jobflow.py", line 60, in <module>
main()
File "./jobflow.py", line 57, in main
args.func(args)
File "./jobflow.py", line 40, in market
pool.map(foo, market_files())
File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/multiprocessing/pool.py", line 225, in map
return self.map_async(func, iterable, chunksize).get()
File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/multiprocessing/pool.py", line 522, in get
raise self._value
TypeError: function takes exactly 1 argument (2 given)
fixtures/txt_data/CSDO.txt obj/txt_data/CSDO.txt
fixtures/txt_data/EMB.txt obj/txt_data/EMB.txt
fixtures/txt_data/GGG.txt obj/txt_data/GGG.txt
fixtures/txt_data/IDL.txt obj/txt_data/IDL.txt
那是一个错误样本。它在文件用尽之前停止。它或者抱怨它想要 2 个 args 但当我更改它以尝试传递两个 args 时只得到 1 个:
def foo(c):
a, b, = c
print a, b
market2.file_main((a, b)) # does comment/uncommenting this break it only because it's in another python file?
def market(args):
"""
read raw ticker data files and output nice, clean, more valid ticker data files
"""
pool = multiprocessing.Pool()
class market_files(object):
for infile in args.infiles:
outfile = os.path.join(args.outdir, os.path.basename(infile))
yield (infile, outfile)
pool.map(foo, market_files())