我对 MPI 规范的理解是,MPI 发送原语是指要发送的数据指向的内存位置(或发送缓冲区),并将该位置的数据作为消息传递给另一个进程。
尽管给定进程的虚拟地址在另一个进程的内存地址中确实没有意义;可以发送指针所指向的数据,例如 void 指针,因为 MPI 会以任何方式将数据本身作为消息传递
例如以下工作正常:
// Sender Side.
int x = 100;
void* snd;
MPI_Send(snd,4,MPI_BYTE,1,0,MPI_COMM_WORLD);
// Receiver Side.
void* rcv;
MPI_Recv(rcv, 4,MPI_BYTE,0,0,MPI_COMM_WORLD);
但是当我在结构中添加void* snd并尝试发送结构时,这将不会成功。
我不明白为什么前面的例子可以正常工作,但下面的例子不能正常工作。
在这里,我定义了一个 typedef 结构,然后从中创建一个 MPI_DataType。与上述相同的解释,以下也应该成功,不幸的是它不起作用。
这是代码:
#include "mpi.h"
#include<stdio.h>
int main(int args, char *argv[])
{
int rank, source =0, tag=1, dest=1;
int bloackCount[2];
MPI_Init(&args, &argv);
typedef struct {
void* data;
int tag;
} data;
data myData;
MPI_Datatype structType, oldType[2];
MPI_Status stat;
/* MPI_Aint type used to idetify byte displacement of each block (array)*/
MPI_Aint offsets[2], extent;
MPI_Comm_rank(MPI_COMM_WORLD, &rank);
offsets[0] = 0;
oldType[0] = MPI_BYTE;
bloackCount[0] = 1;
MPI_Type_extent(MPI_INT, &extent);
offsets[1] = 4 * extent; /*let say the MPI_BYTE will contain ineteger : size of int * extent */
oldType[1] = MPI_INT;
bloackCount[1] = 1;
MPI_Type_create_struct(2, bloackCount,offsets,oldType, &structType);
MPI_Type_commit(&structType);
if(rank == 0){
int x = 100;
myData.data = &x;
myData.tag = 99;
MPI_Send(&myData,1,structType, dest, tag, MPI_COMM_WORLD);
}
if(rank == 1 ){
MPI_Recv(&myData, 1, structType, source, tag, MPI_COMM_WORLD, &stat);
// with out this the following printf() will properly print the value 99 for
// myData.tag
int x = *(int *) myData.data;
printf(" \n Process %d, Received : %d , %d \n\n", rank , myData.tag, x);
}
MPI_Type_free(&structType);
MPI_Finalize();
}
运行代码的错误消息:[看起来我试图在第二个进程中访问无效的内存地址空间]
[ubuntu:04123] *** Process received signal ***
[ubuntu:04123] Signal: Segmentation fault (11)
[ubuntu:04123] Signal code: Address not mapped (1)
[ubuntu:04123] Failing at address: 0xbfe008bc
[ubuntu:04123] [ 0] [0xb778240c]
[ubuntu:04123] [ 1] GenericstructType(main+0x161) [0x8048935]
[ubuntu:04123] [ 2] /lib/i386-linux-gnu/libc.so.6(__libc_start_main+0xf3) [0xb750f4d3]
[ubuntu:04123] [ 3] GenericstructType() [0x8048741]
[ubuntu:04123] *** End of error message ***
有人可以向我解释为什么它不起作用。任何建议也将不胜感激
谢谢,