3

我有一个包含股票代码的向量,例如tickers = ['AAPL','XOM','GOOG'],在我的“传统”python 程序中,我将遍历该tickers向量,选择一个代码字符串,例如AAPL,导入包含AAPL股票收益的 csv 文件,将收益用作通用函数的输入,最后生成一个csv文件作为输出。我有超过 4000 个代码,并且应用于每个代码的功能需要时间来处理。我可以访问带有mpi4py软件包的计算机集群,每个作业可以访问大约 100 个处理器。我很好地理解(并且能够在python中实现)这个mpi 例子:

from mpi4py import MPI

comm = MPI.COMM_WORLD
size = comm.Get_size()
rank = comm.Get_rank()
if rank == 0:
    data = [i for i in range(8)]
# dividing data into chunks
    chunks = [[] for _ in range(size)]
    for i, chunk in enumerate(data):
        chunks[i % size].append(chunk)
else:
    data = None
    chunks = None
data = comm.scatter(chunks, root=0)
print str(rank) + ': ' + str(data)

[cha@cluster] ~/utils> mpirun -np 3 ./mpi.py 
2: [2, 5]
0: [0, 3, 6]
1: [1, 4, 7]

所以在这个例子中,我们有一个大小为 8 的数据向量,并为每个处理器(总共 3 个)分配相等数量的数据元素。我如何使用上面类似的示例并为每个处理器分配一个股票代码并应用需要为每个代码运行的功能?我如何告诉 python 一旦处理器空闲,返回tickers向量并处理ticker尚未处理的 a?

4

1 回答 1

4

还有另一种思考方式。您有 100 个处理器处理 4000 个数据块。一种看待这种情况的方法是,每个处理器都获得一个数据块来进行操作。平均分配,每个处理器将获得 40 个代码来处理。处理器 1 将获得 0-39,处理器 2 将获得 40-79,依此类推。

以这种方式思考,您无需担心处理器完成其任务时会发生什么。只要有一个循环:

block_size = len(tickers) / size # this will be 40 in your example
for i in range(block_size):
    ticker = tickers[rank * block_size + i]
    process(ticker)

def process(ticker):
    # load data
    # process data
    # output data

这有意义吗?

[编辑]
如果您想阅读更多内容,这实际上只是行主要顺序索引的一种变体,这是一种访问存储在单维内存中的多维数据的常用方法。

于 2014-06-16T22:00:25.237 回答