3

我正在尝试将 10GB 的 .dat 文件解析为 .NET 中可识别的内容。列分隔符是“~”,EOL 是“++EOL++”。我知道如何处理分隔符,但是当文件中没有实际的换行符时,我找不到一种简单的方法来处理“++EOL++”。这可以通过 FileHelpers 中的一个选项来处理,还是我必须编写一些自定义的东西?

4

1 回答 1

0

默认情况下,No FileHelpers 不支持具有异常行尾字符序列的文件。

预解析文件并替换 EOL 序列可能是最简单的。但是,它是一个可扩展的库,因此您可以创建自己的DataStorage 子类。你基本上必须覆盖

public override object[] ExtractRecords()
{
    using (MyStreamReader reader = new MyStreamReader(fileName, base.mEncoding, true, 102400))
    {
        T[] localArray = this.ReadStream(reader, maxRecords);
        reader.Close();
        return localArray;
    }
}

然后创建一个新类 MyStreamReader,它与(不幸的是sealed)相同,InternalStreamReader除了ReadLine它包含 EOL 代码

switch (ch)
{
    case '\n':
    case '\r':

    etc...
}

(顺便说一句,我指的是 FileHelpers 2.9.9 的源代码。版本 2.0.0 似乎使用了 aSystem.IO.StreamReader所以你可以将它子类化而不是复制InternalStreamReader.

于 2012-01-13T12:10:07.743 回答