c - MPI_Reduce 没有按预期工作

Question

我对 MPI 很陌生，我正在尝试使用 MPI_Reduce 来查找整数数组的最大值。arr我有一个size的整数数组arraysize，这是我的代码：

MPI_Init(&argc, &argv);
MPI_Comm_size(MPI_COMM_WORLD, &number_of_processes);
MPI_Comm_rank(MPI_COMM_WORLD, &my_process_id);
MPI_Bcast(arr, arraysize, MPI_INT, 0, MPI_COMM_WORLD);
MPI_Reduce(arr, &result, arraysize, MPI_INT, MPI_MAX, 0, MPI_COMM_WORLD);

if(!my_process_id){
    printf("%d", result);
}

MPI_Finalize();

我的程序在 8 个进程上编译并运行没有问题，但是屏幕上没有打印任何内容。出于调试目的，我将条件更改为if(my_process_id)（不带!）并运行。然后我得到一个奇怪的输出，例如000300003 可能不确定地出现在这个列表中的任何位置。3 是我的数组的第一个值（但不是最大值）。我一般都知道并行编程（不是专家，但我通常知道我在做什么）但我对 MPI 很陌生，因为我可能会犯一个明显的错误。我在网上看到的所有教程都有与我相似的代码示例，我不知道我做错了什么。

谢谢，

能。

score 3 · Accepted Answer

MPI_Reduce完全按照它应该工作的方式工作。你是那个没有按照它应该被使用的方式使用它的人。

MPI_Reduce执行按元素减少数据，分布在 MPI 作业的等级中。源缓冲区和目标缓冲区都应该是 size 数组arraysize，例如：

int arr[arraysize];
int result[arraysize];

// Fill local arr with meaningful data
...
// Perform reduction
MPI_Reduce(arr, result, arraysize, MPI_INT, MPI_MAX, 0, MPI_COMM_WORLD);

以下是什么MPI_Reduce：

result[0] = max(arr_0[0], arr_1[0], ..., arr_(N-1)[0]);
result[1] = max(arr_0[1], arr_1[1], ..., arr_(N-1)[1]);
...
result[arraysize-1] = max(arr_0[arraysize-1], ..., arr_(N-1)[arraysize-1]);

其中arr_0是arrrank 0arr_1的副本，arr是 rank 1 的副本，依此类推。

的组合MPI_Bcast，然后是减少，绝对MPI_MAX没有任何作用，因为广播后的所有副本都arr将具有相同的值，并且逐元素max减少的应用只会产生相同的值。更糟糕的是，我会假设result在您的代码中是一个标量整数变量，因此MPI_Reduce会覆盖arraysize-1过去的元素result并且很可能会破坏堆栈框架，覆盖my_process_idin rank的值，0因此它0不再是（因此没有打印任何内容）和崩溃排名0然后。当然，这完全取决于局部变量在堆栈中的排列方式——其含义可能没有我描述的那么严重。

如果您想找到一个数组的最大值，您应该首先使用分配它MPI_Scatter，然后使用MPI_Reduce执行元素级归约，然后对结果执行另一次归约：

int elements_per_proc = arraysize/number_of_processes;
int arr[arraysize];
int subarr[elements_per_proc];
int partres[elements_per_proc];

// Distribute the array
MPI_Scatter(arr, elements_per_proc, MPI_INT,
            subarr, elements_per_proc, MPI_INT, 0, MPI_COMM_WORLD);

// Perform element-wise max reduction
MPI_Reduce(subarr, partres, elements_per_proc, MPI_INT,
           MPI_MAX, 0, MPI_COMM_WORLD);

// Take the highest of the partial max values
result = partres[0];
for (int i = 1; i < elements_per_proc; i++)
   if (partres[i] > result) result = partres[i];

现在你有了中最大元素的值result。

甚至更好：

int localmax;

// Distribute the array
MPI_Scatter(arr, elements_per_proc, MPI_INT,
            subarr, elements_per_proc, MPI_INT, 0, MPI_COMM_WORLD);

// Find the maximum element of the local subarray
localmax = subarr[0];
for (int i = 1; i < elements_per_proc; i++)
   if (subarr[i] > localmax) localmax = subarr[i];

// Perform global max reduction
MPI_Reduce(&localmax, &result, 1, MPI_INT, MPI_MAX, 0, MPI_COMM_WORLD);

c - MPI_Reduce 没有按预期工作

1 回答 1

Related

Reference