假设我有n 个进程,每个进程都拥有一个本地数据,比如一个int。
现在我想重新实现MPI_Allreduce()函数,即计算所有这些整数的全局总和,然后将结果总和广播回进程。
我试图在下面的代码中这样做:
int temp;
int my_sum = temp = my_data;
for (int i = 1; i < size; ++i) {
int partner = (my_rank + 1) % size;
MPI_Sendrecv_replace(&temp, 1, MPI_INT,
partner, 0,
my_rank, 0,
MPI_COMM_WORLD, MPI_STATUS_IGNORE);
my_sum += temp;
}
以便进程以环形方式进行通信,但它是阻塞的。为什么?如何更改代码以使其正常工作?
注意:请不要建议问题的替代(更好)解决方案(显然,其中之一是使用MPI_Allreduce()函数)。我的目标是理解为什么这个代码片段不能像我认为的那样工作。