0

可以帮助如何使用 MPI_Scatter 发送以下矩阵

float **u, **u_local;

if (rank == 0){
    u = (float**) malloc(N * size * sizeof(float*));
    for(i = 0; i < N * size; i++){
        u[i] = (float*) malloc(M * sizeof(float));
        memset(u[i], 0, M * sizeof(float));
    }
}

我想将 u[N][M] 矩阵平等地发送给所有进程(u_local) N 行 M 列

谢谢

4

1 回答 1

0

最简单的解决方案是以线性方式分配内存:

float **u, *u_stor;

if (rank == 0) {
    // Watch out for possible integer overflow while computing memory size
    u_stor = malloc(N * size * M * sizeof(float));
    for (i = 0; i < N * size; i++) {
        u[i] = &u_stor[i * M];
    }
    memset(u_stor, 0, N * size * M * sizeof(float));
}

这段代码不是单独分配每一行,而是u分配一块与整个矩阵一样大的内存,然后分配给u[i]指向i第 - 行开头的指针u_stor。现在行在内存中连续放置,可以使用简单的分散:

float **u_local, *u_local_stor;
u_local_stor = malloc(N * M * sizeof(float));
for (i = 0; i < N; i++)
    u_local[i] = &u_local_stor[i * M];

MPI_Scatter(u[0], N * M, MPI_FLOAT,
            u_local[0], N * M, MPI_FLOAT,
            0, MPI_COMM_WORLD);
于 2012-10-08T08:55:58.260 回答