我正在尝试将 10GB 的 .dat 文件解析为 .NET 中可识别的内容。列分隔符是“~”,EOL 是“++EOL++”。我知道如何处理分隔符,但是当文件中没有实际的换行符时,我找不到一种简单的方法来处理“++EOL++”。这可以通过 FileHelpers 中的一个选项来处理,还是我必须编写一些自定义的东西?
问问题
1069 次
1 回答
0
默认情况下,No FileHelpers 不支持具有异常行尾字符序列的文件。
预解析文件并替换 EOL 序列可能是最简单的。但是,它是一个可扩展的库,因此您可以创建自己的DataStorage 子类。你基本上必须覆盖
public override object[] ExtractRecords()
{
using (MyStreamReader reader = new MyStreamReader(fileName, base.mEncoding, true, 102400))
{
T[] localArray = this.ReadStream(reader, maxRecords);
reader.Close();
return localArray;
}
}
然后创建一个新类 MyStreamReader,它与(不幸的是sealed
)相同,InternalStreamReader
除了ReadLine
它包含 EOL 代码
switch (ch)
{
case '\n':
case '\r':
etc...
}
(顺便说一句,我指的是 FileHelpers 2.9.9 的源代码。版本 2.0.0 似乎使用了 aSystem.IO.StreamReader
所以你可以将它子类化而不是复制InternalStreamReader
.
于 2012-01-13T12:10:07.743 回答