7

我有一个将 TCP 标头表示为结构的 C++ 程序:

#include "stdafx.h"

/*  TCP HEADER

    0                   1                   2                   3   
    0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |          Source Port          |       Destination Port        |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |                        Sequence Number                        |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |                    Acknowledgment Number                      |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |  Data |           |U|A|P|R|S|F|                               |
   | Offset| Reserved  |R|C|S|S|Y|I|            Window             |
   |       |           |G|K|H|T|N|N|                               |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |           Checksum            |         Urgent Pointer        |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |                    Options                    |    Padding    |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |                             data                              |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

*/

typedef struct {        // RFC793
    WORD         wSourcePort;
    WORD         wDestPort;
    DWORD        dwSequence;
    DWORD        dwAcknowledgment;
    unsigned int byReserved1:4;
    unsigned int byDataOffset:4;
    unsigned int fFIN:1;
    unsigned int fSYN:1;
    unsigned int fRST:1;
    unsigned int fPSH:1;
    unsigned int fACK:1;
    unsigned int fURG:1;
    unsigned int byReserved2:2;
    unsigned short wWindow;
    WORD         wChecksum;
    WORD         wUrgentPointer;
} TCP_HEADER, *PTCP_HEADER;


int _tmain(int argc, _TCHAR* argv[])
{
    printf("TCP header length: %d\n", sizeof(TCP_HEADER));
    return 0;
}

如果我运行这个程序,我会得到这个标头的大小为 24 字节,这不是我期望的大小。如果我将字段“wWindow”的类型更改为“unsigned int wWindow:16”,它的位数与 unsigned short 相同,程序会告诉我结构的大小现在是 20 字节,这是正确的大小。为什么是这样?

我在 32 位 x86 机器上使用带有 SP1 的 Microsoft Visual Studio 2005。

4

9 回答 9

6

因为编译器将您的位域打包成 32 位 int,而不是 16 位实体。

通常,您应该避免使用位域并使用其他具有显式位掩码和移位的清单常量(枚举或其他)来访问字段中的“子字段”。

这是应该避免位域的一个原因 - 即使对于同一平台,它们在编译器之间也不是很便携。来自 C99 标准(C90 标准中有类似的措辞):

实现可以分配任何大到足以容纳位域的可寻址存储单元。如果有足够的空间剩余,紧跟在结构中另一个位域之后的位域将被打包到同一单元的相邻位中。如果剩余空间不足,则将不适合的位域放入下一个单元还是与相邻单元重叠是实现定义的。单元内位域的分配顺序(高位到低位或低位到高位)是实现定义的。未指定可寻址存储单元的对齐方式。

您无法保证位域是否会“跨越”一个 int 边界,并且您无法指定位域是从 int 的低端还是 int 的高端开始(这与处理器是否大端或小端)。

于 2008-09-29T18:24:50.347 回答
4

您的一系列“unsigned int:xx”位域仅使用了 int 中 32 位中的 16 位。其他 16 位(2 个字节)在那里,但未使用。紧随其后的是 unsigned short,它位于 int 边界上,然后是一个 WORD,它在 int 边界上对齐,这意味着它们之间有 2 个字节的填充。

当您切换到“unsigned int wWindow:16”时,编译器不会使用单独的短字节,而是使用前一个位域的未使用部分,因此不会浪费,不会短缩,也不会在短缩之后填充,因此您节省了四个字节。

于 2008-09-29T19:20:22.943 回答
2

请参阅这个问题:为什么结构的 sizeof 不等于每个成员的 sizeof 之和?.

我相信当您使用“unsigned int wWindow:16”语法时,编译器会提示禁用填充。

另外,请注意,不保证短路为 16 位。保证是:16 位 <= short 的大小 <= int 的大小。

于 2008-09-29T18:28:36.500 回答
0

编译器将非位域结构成员填充为 32 位 - 本机字对齐。要解决此问题,请在结构之前执行 #pragma pack(0) 并在之后执行 #pragma pack()。

于 2008-09-29T18:24:50.597 回答
0

编译器可以根据字段的大小和顺序填充内存中的结构边界。

于 2008-09-29T18:25:08.643 回答
0

在打包方面不是 C/C++ 专家。但我想规范中有一条规则说,当一个非位域跟随一个位域时,它必须在字边界上对齐,无论它是否适合剩余空间。通过使其成为显式位向量,您可以避免此问题。

这又是带有一点经验的推测。

于 2008-09-29T18:27:42.413 回答
0

有趣 - 我认为“WORD”会评估为“无符号短”,所以你会在不止一个地方遇到这个问题。

另请注意,您需要处理任何超过 8 位的值的字节序问题。

于 2008-09-29T18:29:13.190 回答
0

由于编译器打包规则,您会看到不同的值。您可以在此处查看特定于 Visual Studio 的规则。

当您有一个必须打包的结构(或遵守某些特定的对齐要求)时,您应该使用 #pragma pack() 选项。对于您的代码,您可以使用 #pragma pack(0) 它将所有结构成员对齐字节边界。然后,您可以使用 #pragma pack() 将结构打包重置为其默认状态。您可以在此处查看有关 pack pragma 的更多信息。

于 2008-09-29T18:36:13.627 回答
0

我认为 Mike B 是对的,但不是很清楚。当您要求“短”时,它在 32 位边界上对齐。当您要求 int:16 时,它不是。所以 int:16 正好在 ebit 字段之后,而 short 跳过 2 个字节并从下一个 32 位块开始。

他所说的其余部分是完全适用的——位字段绝不能用于编码外部可见的结构,因为不能保证它们是如何分配的。充其量,它们属于保存字节很重要的嵌入式程序。即使在那里,您也不能使用它们来实际控制内存映射端口中的位。

于 2008-09-29T20:56:50.340 回答