2

我想读\写一个具有以下结构的二进制文件:

在此处输入图像描述

该文件由“记录”组成。每个“记录”具有以下结构:我将以第一条记录为例

  • (红色)起始字节:0x5A(始终为 1 字节,固定值 0x5A)
  • (绿色)LENGTH 字节:0x00 0x16(总是 2 字节,值可以从“0x00 0x02”变为“0xFF 0xFF”)
  • (蓝色) CONTENT:由 LENGTH 字段的十进制值减去 2 表示的字节数。在这种情况下,LENGHT 字段的值为 22(0x00 0x16 转换为十进制),因此 CONTENT 将包含 20 (22 - 2) 个字节。

我的目标是逐条读取每条记录,并将其写入输出文件。实际上我有一个读函数和写函数(一些伪代码):

private void Read(BinaryReader binaryReader, BinaryWriter binaryWriter)
{
    byte START = 0x5A;
    int decimalLenght = 0;
    byte[] content = null;
    byte[] length = new byte[2];

    while (binaryReader.PeekChar() != -1)
    {
        //Check the first byte which should be equals to 0x5A
        if (binaryReader.ReadByte() != START)
        {
            throw new Exception("0x5A Expected");
        }

        //Extract the length field value
        length = binaryReader.ReadBytes(2);

        //Convert the length field to decimal
        int decimalLenght = GetLength(length);

        //Extract the content field value
        content = binaryReader.ReadBytes(decimalLenght - 2);

        //DO WORK
        //modifying the content

        //Writing the record
        Write(binaryWriter, content, length, START);
    }
}

private void Write(BinaryWriter binaryWriter, byte[] content, byte[] length, byte START)
{
    binaryWriter.Write(START);
    binaryWriter.Write(length);
    binaryWriter.Write(content);   
}

这种方式实际上是有效的。但是,由于我正在处理非常大的文件,我发现它根本没有执行,因为我对每个记录进行了 3 次读写。实际上,我想读取错误的数据块而不是少量字节,并且可能在内存中工作,但是我在使用 Stream 方面的经验停止使用 BinaryReader 和 BinaryWriter。提前致谢。

4

2 回答 2

2

FileStream已经缓冲了,所以我希望它可以很好地工作。如果你真的需要,你总是可以BufferedStream围绕原始流创建一个额外的缓冲,但我怀疑它会产生显着的差异。

你说它“根本没有表现”——它的工作速度有多?您有多确定 IO 是您的时间去向?您是否对代码进行了任何分析?

于 2011-11-04T17:43:50.297 回答
1

我可能还建议您最初读取 3 个(或 6 个?)字节,而不是 2 个单独的读取。将初始字节放入一个小数组中,检查 5a ck-byte,然后是 2 字节长度指示符,然后是 3 字节 AFP 操作码,然后,读取 AFP 记录的其余部分。

这是一个很小的区别,但它摆脱了您的一个读取调用。

我不是 Jon Skeet,但我确实在该国最大的印刷和邮件商店之一工作了很长一段时间,我们主要做 AFP 输出:-)

(但通常在 C 中)

于 2012-12-08T20:11:43.293 回答