4

我在 Linux Centos 4 机器和使用 Gentoo 运行 Interix 的 Windows XP 机器之间通过 TCP 套接字发送数据包。当 Interix 接收到数据包时,大约 10% 的字符始终以与数据包开头完全相同的偏移量进行加扰。在发送 Linux 端,数据包具有以下正确内容:

-----BEGIN PUBLIC KEY----- 
MIIBojCCARcGByqGSM4+AgEwggEKAoGBAP//////////yQ/aoiFowjTExmKLgNwc
                                        ^   ^^^^^^^^^^^^^   
0SkCTgiKZ8x0Agu+pjsTmyJRSgh5jjQE3e+VGbPNOkMbMCsKbfJfFDdP4TVtbVHC
^^^^^^^^
ReSFtXZiXn7G9ExC6aY37WsL/1y29Aa37e44a/taiZ+lrp8kEXxLH+ZJKGZR7OZT 
gf//////////AgECAoGAf//////////kh+1RELRhGmJjMUXAbg5olIEnBEUz5joB 
Bd9THYnNkSilBDzHGgJu98qM2eadIY2YFYU2+S+KG6fwmra2qOEi8kLauzEvP2N6 
JiF00xv2tYX/rlt6A1v29xw1/a1Ez9LXT5IIviWP8ySUMyj2cynA//////////8D 
gYQAAoGAKcjWmS+h/a6xY6HfNeVBk+vU4ZQoi4ROBT8NXdiFQUeLwT/WpE/8oAxn 
KCOssVcoF54bF8JlEL0McWjQUzMrqoQedizALRRdH7kTUM/yqZZdxLgRFmiFDUXT 
XxsFFB5hlLpMqy9lqpNMN8+e5m9ISgu8zHMlTBQXsnwds0VkbeU=
-----END PUBLIC KEY-----

但是在 Interix 上,数据包的内容有些混乱(但大部分是正确的):

-----BEGIN PUBLIC KEY-----
MIIBojCCARcGByqGSM4+AgEwggEKAoGBAP//////y////iFowjTExQ/aomKLgNwc
                                        ^   ^^^^^^^^^^^^^ 
KigTCkS0Z8x0Agu+pjsTmyJRSgh5jjQE3e+VGbPNOkMbMCsKbfJfFDdP4TVtbVHC
^^^^^^^^
ReSFtXZiXn7G9ExC6aY37WsL/1y29Aa37e44a/taiZ+lrp8kEXxLH+ZJKGZR7OZT 
gf//////////AgECAoGAf//////////kh+1RELRhGmJjMUXAbg5olIEnBEUz5joB 
Bd9THYnNkSilBDzHGgJu98qM2eadIY2YFYU2+S+KG6fwmra2qOEi8kLauzEvP2N6 
JiF00xv2tYX/rlt6A1v29xw1/a1Ez9LXT5IIviWP8ySUMyj2cynA//////////8D 
gYQAAoGAKcjWmS+h/a6xY6HfNeVBk+vU4ZQoi4ROBT8NXdiFQUeLwT/WpE/8oAxn 
KCOssVcoF54bF8JlEL0McWjQUzMrqoQedizALRRdH7kTUM/yqZZdxLgRFmiFDUXT 
XxsFFB5hlLpMqy9lqpNMN8+e5m9ISgu8zHMlTBQXsnwds0VkbeU=
-----END PUBLIC KEY-----

我已经指出了与上述^字符的不同之处。y给定的重复字符周围可能还有几个字符/会隐藏在该部分中移动的其他字符。

此代码在几个平台对之间运行良好:

  • Linux 和 Linux
  • Linux 和 BSD
  • Linux 和 Cygwin

这可能是 Interix 和 Gentoo 代码中的错误吗?我在 Windows XP、Interix v3.5 上运行。我注意到所有正确的字符都出现了,但是它们的顺序一直被打乱,部分被颠倒了,其他的被剪切并重新插入到不同的地方。正在接收端使用::read()TCP 套接字文件描述符读取数据包。这里有很多代码在起作用,所以我不确定哪些部分最相关,但如果提出特定请求,我会尝试添加更多代码。

const int fd; // Passed in by caller.
char *buf;    // Passed in by caller.

size_t want = count; // This value is 625 for the packet in question.
// As ::read() is called, got is adjusted, until the whole packet is read.
size_t got = 0;

while (got < want) {
  // We call ::select() to ensure bytes are available before calling ::read().
  ssize_t result = ::read(fd, buf, want - got);

  if (result < 0) {
    // Handle error (not getting called, so omitted).
  } else {
    if (result != 0) {
      // We are coming in here in one try and got is set to 625, the amount we want...
      // Not an error, increment the byte counter 'got' & the read pointer,
      // buf.
      got += result;
      buf += result;
    } else { // EOF because zero result from read.
      eof = true; // Connection reset by peer.
      break;
    }
  }
}

我可以进行哪些实验来帮助确定错误的来源?

4

2 回答 2

0

我会说您在 'buf' 上有一个并发错误,或者可能是重复的free()或在free().

于 2013-04-29T05:49:14.233 回答
0

谜团已揭开!问题是off_t在 windows XP 机器上是 32 位宽,在 Centos 机器上是 64 位宽。当数据包被发送时,它包含一些off_t对象的内存布局被从主机放入网络字节顺序(小端到大端),然后在 Windows 机器上,当它收到数据包时,它从网络返回到主机。因为内存布局不同,我得到了上面看到的加扰。

soff_t我通过在 64 位宽的任何地方使用我自己的解决了这个问题。

但是,然后我遇到了另一个问题,编译器在两台机器上没有以相同的方式打包结构,在 Windows 上它插入了 4 个字节以使 long long 8 字节对齐,而在 Centos 上它没有这样做:

typedef struct Option
{
  char[56]    _otherStuff;
  int         _cpuFreq;   
  int         _bufSize;
  soff_t      _fileSize;    // Original bug fixed by forcing these 8 bytes wide.
  soff_t      _seekTo;      // Original bug fixed by forcing these 8 bytes wide.
  int         _optionBits;
  int         _padding;     // To fix next bug, I added this 4 bytes
  long long   _mtime;
  long long   _mode;
} __attribute__ ((aligned(1), packed)) Option;

我曾使用__attribute__ ((aligned(1), packed))来强制包装保持一致和密集,但在 Windows XP 上,这没有或无法兑现。我通过添加_padding强制下一个 8 字节成员在 Centos 上以 8 字节对齐来解决这个问题,因此与 Windows XP 一致。

于 2013-05-24T23:57:57.297 回答