c - 通过创建 MPI 驱动的数据类型发送包含 void* 的 typedef 结构。

Question

我对 MPI 规范的理解是，MPI 发送原语是指要发送的数据指向的内存位置（或发送缓冲区），并将该位置的数据作为消息传递给另一个进程。

尽管给定进程的虚拟地址在另一个进程的内存地址中确实没有意义；可以发送指针所指向的数据，例如 void 指针，因为 MPI 会以任何方式将数据本身作为消息传递

例如以下工作正常：

    // Sender Side.
    int x = 100;
    void* snd;
    MPI_Send(snd,4,MPI_BYTE,1,0,MPI_COMM_WORLD);   

    // Receiver Side.
    void* rcv;
    MPI_Recv(rcv, 4,MPI_BYTE,0,0,MPI_COMM_WORLD);

但是当我在结构中添加void* snd并尝试发送结构时，这将不会成功。

我不明白为什么前面的例子可以正常工作，但下面的例子不能正常工作。

在这里，我定义了一个 typedef 结构，然后从中创建一个 MPI_DataType。与上述相同的解释，以下也应该成功，不幸的是它不起作用。

这是代码：

    #include "mpi.h"
    #include<stdio.h>

    int main(int args, char *argv[])
    {
        int rank, source =0, tag=1, dest=1;
        int bloackCount[2];

        MPI_Init(&args, &argv);

        typedef struct {
            void* data;
            int tag; 
        } data;

        data myData;    

        MPI_Datatype structType, oldType[2];
        MPI_Status stat;

        /* MPI_Aint type used to idetify byte displacement of each block (array)*/      
        MPI_Aint offsets[2], extent;
        MPI_Comm_rank(MPI_COMM_WORLD, &rank);


        offsets[0] = 0;
        oldType[0] = MPI_BYTE;
            bloackCount[0] = 1;

        MPI_Type_extent(MPI_INT, &extent);

        offsets[1] = 4 * extent;  /*let say the MPI_BYTE will contain ineteger :         size of int * extent */
        oldType[1] = MPI_INT;
        bloackCount[1] = 1;

        MPI_Type_create_struct(2, bloackCount,offsets,oldType, &structType);
        MPI_Type_commit(&structType);


        if(rank == 0){
    int x = 100;
    myData.data = &x;
    myData.tag = 99;
    MPI_Send(&myData,1,structType, dest, tag, MPI_COMM_WORLD);
}
if(rank == 1 ){ 
    MPI_Recv(&myData, 1, structType, source, tag, MPI_COMM_WORLD, &stat);
          // with out this the following printf() will properly print the value 99 for 
          // myData.tag
    int x = *(int *) myData.data;
    printf(" \n Process %d, Received : %d , %d \n\n", rank , myData.tag, x); 
    }   
       MPI_Type_free(&structType);             
       MPI_Finalize();
    }

运行代码的错误消息：[看起来我试图在第二个进程中访问无效的内存地址空间]

    [ubuntu:04123] *** Process received signal ***
    [ubuntu:04123] Signal: Segmentation fault (11)
    [ubuntu:04123] Signal code: Address not mapped (1)
    [ubuntu:04123] Failing at address: 0xbfe008bc
    [ubuntu:04123] [ 0] [0xb778240c]
    [ubuntu:04123] [ 1] GenericstructType(main+0x161) [0x8048935]
    [ubuntu:04123] [ 2] /lib/i386-linux-gnu/libc.so.6(__libc_start_main+0xf3)         [0xb750f4d3]
    [ubuntu:04123] [ 3] GenericstructType() [0x8048741]
    [ubuntu:04123] *** End of error message ***

有人可以向我解释为什么它不起作用。任何建议也将不胜感激

谢谢，

score 5 · Accepted Answer

// Sender Side.
int x = 100;
void* snd;
MPI_Send(snd,4,MPI_BYTE,1,0,MPI_COMM_WORLD);

// Receiver Side.
void* rcv;
MPI_Recv(rcv, 4,MPI_BYTE,0,0,MPI_COMM_WORLD);

我不明白为什么前面的例子可以正常工作，但下面的例子不能正常工作。

它可以工作（当然，snd并且rcv必须分配有意义的内存位置作为值），因为MPI_SendandMPI_Recv获取数据位置的地址，并且两者snd都是rcv指针，即它们的值就是这样的地址。例如，该MPI_Send行不是发送指针本身的值，而是从snd指向的位置开始的 4 个字节。对的调用MPI_Recv和使用也是如此rcv。为了发送指针的值而不是它指向的值，您必须使用：

MPI_Send(&snd, sizeof(void *), MPI_BYTE, ...);

这将从sizeof(void *)存储指针值的地址开始发送字节。除非某些超级特殊情况，否则这将毫无意义。

为什么你的第二个例子不起作用？MPI 不是魔术师，它无法识别部分内存包含指向另一个内存块的指针并跟随该指针。也就是说，当你构造一个结构化数据类型时，没有办法告诉 MPI 结构的第一个元素实际上是一个指针，并让它读取这个指针指向的数据。换句话说，您必须执行显式数据编组- 构造和中间缓冲区，其中包含由 . 指向的内存区域的副本data.data。此外，您的数据结构不包含有关data指向的内存区域长度的信息。

请注意一些非常重要的事情。所有 MPI 数据类型都有一个叫做类型映射的东西。类型映射是一个元组列表，其中每个元组（也称为类型签名）的形式为(basic_type, offset)wherebasic_type是原始语言类型，例如char, int,double等，并且offset是相对于缓冲区开头的偏移量。MPI 的一个特殊特性是偏移量也可以是负数，这意味着 to MPI_Send（或 toMPI_Recv或任何其他通信函数）的参数实际上可能指向内存区域的中间，这将用作数据源。发送数据时，MPI 遍历类型映射，basic_type从对应的类型中取出一个元素offset，相对于提供的数据缓冲区地址。内置 MPI 数据类型只有一个条目的类型映射，偏移量为0，例如：

MPI_INT      -> (int, 0)
MPI_FLOAT    -> (float, 0)
MPI_DOUBLE   -> (double, 0)

MPI 中不存在任何数据类型，这可以使其脱离指针并获取它指向的值而不是指针值本身。

offsets[0] = 0;
oldType[0] = MPI_BYTE;
blockCount[0] = 1;

MPI_Type_extent(MPI_INT, &extent);

offsets[1] = 4 * extent;
oldType[1] = MPI_INT;
blockCount[1] = 1;

MPI_Type_create_struct(2, blockCount, offsets, oldType, &structType);

此代码创建具有以下类型映射的 MPI 数据类型（假设int为 4 个字节）：

{(byte, 0), (int, 16)}

当作为类型参数提供给MPI_Send时，它将指示 MPI 库从数据缓冲区的开头获取一个字节，然后获取位于数据缓冲区开头之后 16 个字节处的整数值。尽管缓冲区的跨度为 20 字节，但消息总共有 5 个字节长。

offsets[0] = offsetof(data, data);
oldType[0] = MPI_CHAR;
blockCount[0] = sizeof(void *);

offsets[1] = offsetof(data, tag);
oldType[1] = MPI_INT;
blockCount[1] = 1;

MPI_Type_create_struct(2, blockCount, offsets, oldType, &structType);

这段代码取自 Greg Inozemtsev 的回答，创建了一个具有以下类型映射的数据类型（假设 32 位机器具有 32 位宽的指针和零填充）：

{(char, 0), (char, 1), (char, 2), (char, 3), (int, 4)}

类型信号的数量(char, x)等于sizeof(void *)（假设为 4）。如果用作数据类型，这将占用缓冲区开头的 4 个字节（即指针的值，地址，而不是它指向的实际 int！），然后它将占用 4 个字节后的整数开头，即tag结构中字段的值。再一次，您将发送指针的地址，而不是该指针指向的数据。

MPI_CHAR和之间的区别MPI_BYTE在于没有类型转换应用于 type 的数据MPI_BYTE。这仅在异构环境中运行 MPI 代码时相关。使用MPI_CHAR该库可以执行数据转换，例如将每个字符从 ASCII 转换为 EBCDIC 字符集，反之亦然。在这种情况下使用MPI_CHAR是错误的，但是在异构环境中发送指针更加错误，所以不用担心；）

鉴于这一切，如果我是你，我会考虑 suszterpatt 提出的解决方案。

对于显式数据编组，有两种可能的情况：

场景 1. 指向的每个数据项data.data的大小都是恒定的。在这种情况下，您可以通过以下方式构造结构数据类型：

typedef struct {
   int tag;
   char data[];
} data_flat;

// Put the tag at the beginning
offsets[0] = offsetof(data_flat, tag);
oldType[0] = MPI_INT;
blockCount[0] = 1;

offsets[1] = offsetof(data_flat, data);
oldType[1] = MPI_BYTE;
blockCount[1] = size of the data;

MPI_Type_create_struct(2, blockCount, offsets, oldType, &structType);
MPI_Type_commit(&structType);

然后像这样使用它：

// --- Sender ---

// Make a temporary buffer to hold the data
size_t total_size = offsetof(data_flat, data) + size of the data;
data_flat *temp = malloc(total_size);

// Copy data structure content into the temporary flat structure
temp->tag = data.tag;
memcpy(temp->data, data.data, size of the data);

// Send the temporary structure
MPI_Send(temp, 1, structType, ...);

// Free the temporary structure
free(temp);

您也可能不会释放临时存储，而是将其重用于data结构的其他实例（因为假设它们都指向相同大小的数据）。接收者将是：

// --- Receiver ---

// Make a temporary buffer to hold the data
size_t total_size = offsetof(data_flat, data) + size of the data;
data_flat *temp = malloc(total_size);

// Receive into the temporary structure
MPI_Recv(temp, 1, structType, ...);

// Copy the temporary flat struture into a data structure
data.tag = temp->tag;
data.data = temp->data;
// Do not free the temporary structure as it contains the actual data

场景 2. 每个数据项的大小可能不同。这个涉及更多，并且很难以便携的方式进行。如果速度不是您最关心的问题，那么您可以通过两条不同的消息发送数据以获得最大的可移植性。MPI 保证为使用相同信封发送的消息保留顺序(source, destination, tag, communicator)。

您还可以通过以下方式实现 suszterpatt 建议的内容（假设您的标签符合允许的范围）：

// --- Send a structure ---
MPI_Send(data.data, size of data, MPI_BYTE, dest, data.tag, MPI_COMM_WORLD);

// --- Receive a structure ---
MPI_Status status;
MPI_Aint msg_size;
// Peek for a message, allocate big enough buffer
MPI_Probe(source, MPI_ANY_TAG, &status);
MPI_Get_count(&status, MPI_BYTE, &msg_size);
uint8_t *buffer = malloc(msg_size);
// Receive the message
MPI_Recv(buffer, (int)msg_size, MPI_BYTE, source, status.MPI_TAG,
         MPI_COMM_WORLD, MPI_STATUS_IGNORE);
// Fill in a data structure
data.tag = status.MPI_TAG;
data.data = buffer;

score 4 · Accepted Answer

假设您定义此结构是因为您想将不同的数据与不同的标签配对，那么您的解决方案在概念上是错误的。考虑以下示例：

data foo, bar;
int x = 100;
foo.data = bar.data = &x;
foo.tag = bar.tag = 99;

在这种情况下，foo每个bar人都会在内存中拥有自己的副本tag，但它们指向的是同一条数据。因此，不可能定义可用于发送两个元素的单个 MPI 数据类型，因为它们各自data和tag元素之间的位移是不同的。除了最幸运的情况外，对于不同的数据指针也是如此。

如果您希望配对数据和标签，您仍然可以使用您的data结构，但由于上述原因，您不需要自定义 MPI 数据类型：

MPI_Send(myData.data,extent,MPI_BYTE, dest, myData.tag, MPI_COMM_WORLD);

匹配接收：

MPI_Recv(myData.data, extent, MPI_BYTE, source, myData.tag, MPI_COMM_WORLD, &stat);

score 1 · Accepted Answer

MPI 数据类型中的偏移量tag错误。一般来说，您不能假设 a与 avoid*的大小相同int。struct此外，随着更多字段的添加，可能会引入填充。不过有办法解决这个问题 - 只需使用offsetof：

offsets[0] = offsetof(data, data);
oldType[0] = MPI_BYTE;
blockCount[0] = sizeof(void *);

offsets[1] = offsetof(data, tag);
oldType[1] = MPI_INT;
blockCount[1] = 1;

MPI_Type_create_struct(2, blockCount, offsets, oldType, &structType);

还有一件事：由于指针在目的地无论如何都没有意义，您可以在 MPI 数据类型中跳过它。

c - 通过创建 MPI 驱动的数据类型发送包含 void* 的 typedef 结构。

3 回答 3

Related

Reference