通常,要从字节流中读取字符,您使用 StreamReader。在此示例中,我正在从无限流中读取由 '\r' 分隔的记录。
using(var reader = new StreamReader(stream, Encoding.UTF8))
{
var messageBuilder = new StringBuilder();
var nextChar = 'x';
while (reader.Peek() >= 0)
{
nextChar = (char)reader.Read()
messageBuilder.Append(nextChar);
if (nextChar == '\r')
{
ProcessBuffer(messageBuilder.ToString());
messageBuilder.Clear();
}
}
}
问题是 StreamReader 的内部缓冲区很小,因此如果代码等待“记录结束”分隔符(在本例中为“\r”),它必须等到 StreamReader 的内部缓冲区被刷新(通常是因为更多字节已经到了)。
此替代实现适用于单字节 UTF-8 字符,但在多字节字符上会失败。
int byteAsInt = 0;
var messageBuilder = new StringBuilder();
while ((byteAsInt = stream.ReadByte()) != -1)
{
var nextChar = Encoding.UTF8.GetChars(new[]{(byte) byteAsInt});
Console.Write(nextChar[0]);
messageBuilder.Append(nextChar);
if (nextChar[0] == '\r')
{
ProcessBuffer(messageBuilder.ToString());
messageBuilder.Clear();
}
}
如何修改此代码以使其适用于多字节字符?