我正在使用套接字连接到各种 XML Web 服务。但是当我将收到的字节转换为字符串(通常是 UTF-8 编码)时,我得到了一些额外的字符串。大多数情况下,返回的字符串以“4000\r\n”之类的开头,然后在数据中穿插“\r\n4000\r\n”。其他时候,字符串可以是“\r\nd1ef\r\n”或 4-8 个十六进制“字母”的其他组合。有时它是一次性的。我注意到的一些东西:
- 如果开头没有“xxxx\r\n”,则字符串是干净的
- 如果我多次调用相同的 URL,我总是得到相同的结果(相同位置的相同额外字符串)
- 字符串通常是 4 个十六进制字符,周围有“\r\n”,但也可以是 8 个十六进制字符
- 它发生在许多不同的网络服务中,所以它可能不在服务器端
- 由于它总是以“\r\n”开头和结尾,它不能是随机的额外数据字节
我猜这是某种 HTTP“分页”功能或我不知道的东西。
这是我的代码:
var client = new Socket(AddressFamily.InterNetwork, SocketType.Stream, ProtocolType.Tcp);
client.ReceiveTimeout = timeout;
client.SendTimeout = timeout;
client.NoDelay = true;
client.Connect(server, port);
//send HTTP request
client.Send(totalData, totalData.Length, SocketFlags.None);
//read the data
var buffer = new byte[32];
byteStream = new MemoryStream();
while (true)
{
var readCount = client.Receive(buffer, buffer.Length, SocketFlags.None);
if (readCount > 0)
{
byteStream.Write(buffer, 0, readCount);
}
else
break;
}
client.Disconnect(false);
client.Close();
//get the HTTP response
var bytes = byteStream.ToArray();
var ascii = Encoding.ASCII.GetString(bytes.ToArray());
var bodyPosition = ascii.IndexOf("\r\n\r\n") + 4;
var bodyBytes = new byte[bytes.Length - bodyPosition];
Array.Copy(bytes,bodyPosition,bodyBytes,0,bodyBytes.Length);
var body = dataEncoding.GetString(bodyBytes);
有谁知道我做错了什么?