0

我使用过 MPI 代码并且对这些概念有一些基本的想法,但我自己从未做过任何 MPI 开发。我从并行化我的一些 python 代码开始。以下是我正在尝试做的片段:

IMPORT STUFF
...
comm = MPI.COMM_WORLD
size = comm.Get_size()
rank = comm.Get_rank()
status = MPI.Status()
comm.Barrier()
## CREATE EMPTY ARRAYS
if rank == 0:
   t_start=MPI.Wtime()
   tt =np.zeros(nt)
   ezp=np.zeros(nt)
   ezm=np.zeros(nt)
## NUMBER CRUNCHING LOOP
for it in range(rank,nt,comm.size):
   ...
   DO SOMETHING
   ...
## IF RANK == 0, POPULATE OWN PARTS OF ARRAY
   if rank == 0:
      tt[ it] = ltt
      ezp[it] = lezp
      ezm[it] = lezm
   if rank > 0:
   ## IF RANK != 0, SEND DATA TO PROC 0
      snddata=[it,ltt,lezp,lezm]
      comm.send(snddata, dest=0, tag=13)
   else:
#  IF RANK == 0, RECEIEVE THE DATA FROM ALL PROCS AND POPULATE
#  CORRESPONDING ARRAY ELEMENTS
      for src in range(1,comm.size):
         rcvdata=comm.recv(source=src,tag=13,status=status)
         tt[ rcvdata[0]] = rcvdata[1]
         ezp[rcvdata[0]] = rcvdata[2]
         ezm[rcvdata[0]] = rcvdata[3]
comm.Barrier()
...
WRITE THE RESULTS tt[:], ezp[:], ezm[:] TO FILE

我运行代码

mpirun -np 2 python mycode.py ARGUMENTS

问题是有时循环分解不会为 procs 提供相等大小的循环。例如,如果 nt=21 并且我使用 2 个 proc,则 proc 0 循环:

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20]

和 proc 1 循环:

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]

因此,对于 it=20,proc 0 一直在等待收到 proc 1 的消息,而 proc 1 没有做任何事情。显然,对于任何不具有 nt%np=0 的 nt 和 np 组合,我都会遇到这个问题。

在这种情况下设置通信的好方法是什么?

谢谢!

4

1 回答 1

0

想到的第一种方法是在一次(或两次)调用中发送所有数据。

  • 如果存在“最可能”的状态,则接收最可能的状态。发件人将发送它拥有的东西,但接收的少于请求的数量是可以的。

  • 如果这不可行,请使用两条消息:一个发送/接收对交换一个 int - 下一条消息中期望的值的数量。然后下一条消息有那么多值。

您没有明确提出此问题,但您的代码以“将结果写入文件”结尾。也许您可以一起避免发送/接收?如果您所做的只是收集排名 0 的答案,那么您可能想要研究 MPI-IO 方法并让每个进程直接写入文件。

于 2015-10-27T16:10:11.447 回答