5

我有一个int我打算从根 ( rank==(FIELD=0)) 广播。

int winner

if (rank == FIELD) {
    winner = something;
}

MPI_Barrier(MPI_COMM_WORLD);
MPI_Bcast(&winner, 1, MPI_INT, FIELD, MPI_COMM_WORLD);
MPI_Barrier(MPI_COMM_WORLD);
if (rank != FIELD) {
    cout << rank << " informed that winner is " << winner << endl;
}

但看来我明白了

[JM:6892] *** An error occurred in MPI_Bcast
[JM:6892] *** on communicator MPI_COMM_WORLD
[JM:6892] *** MPI_ERR_TRUNCATE: message truncated
[JM:6892] *** MPI_ERRORS_ARE_FATAL: your MPI job will now abort

发现我可以增加缓冲区大小Bcast

MPI_Bcast(&winner, NUMPROCS, MPI_INT, FIELD, MPI_COMM_WORLD);

NUMPROCS正在运行的进程数在哪里。(实际上似乎我只需要它是2)。然后它运行,但给出了意外的输出......

1 informed that winner is 103
2 informed that winner is 103
3 informed that winner is 103
5 informed that winner is 103
4 informed that winner is 103

当我coutwinner它应该是-1

4

1 回答 1

10

您的代码早期存在错误:

if (rank == FIELD) {
   // randomly place ball, then broadcast to players
   ballPos[0] = rand() % 128;
   ballPos[1] = rand() % 64;
   MPI_Bcast(ballPos, 2, MPI_INT, FIELD, MPI_COMM_WORLD);
}

这是一个非常常见的错误。MPI_Bcast是一个集体操作,它必须被所有进程调用才能完成。在您的情况下发生的情况是,该广播不会被所有进程MPI_COMM_WORLD(但仅由根)调用,因此会干扰下一个广播操作,即循环内的广播操作。第二个广播操作实际上将第一个(两个int元素)发送的消息接收到一个缓冲区中int因此截断错误消息。在 Open MPI 中,每个广播在内部使用相同的消息标记值,因此不同的广播可能会相互干扰,而不是按顺序发布。这符合(旧)MPI 标准 - 在 MPI-2.2 中,一个人不能拥有多个未完成的集体操作(在 MPI-3.0 中,一个人可以拥有多个未完成的非阻塞集体操作)。您应该将代码重写为:

if (rank == FIELD) {
   // randomly place ball, then broadcast to players
   ballPos[0] = rand() % 128;
   ballPos[1] = rand() % 64;
}
MPI_Bcast(ballPos, 2, MPI_INT, FIELD, MPI_COMM_WORLD);
于 2012-11-08T16:02:04.810 回答