3

如何使用某些行 TFileStream 读取文件。我读了有数百万个文件的行。所以我想在我只会使用的记忆中玩耍

例子:

Line 1: 00 00 00 00 00 00 00 00
Line 2: 00 00 00 00 00 00 00 00
Line 3: 00 00 00 00 00 00 00 00
Line 4: 00 00 00 00 00 00 00 00
Line 5: 00 00 00 00 00 00 00 00

我读了第 2 到 4 行

我使用了一个函数TextFile,但它似乎很慢。刚刚找到了一个读取 TFileStream 中最后一行的函数。

4

3 回答 3

12

您可以使用 TFileStream 类打开文件以进行读取,如下所示...

FileStream := TFileStream.Create( 'MyBigTextFile.txt', fmOpenRead)

TFileStream 不是一个引用计数的对象,所以一定要在完成后释放它,就像这样......

FileStream.Free

从现在开始,我将假设您的文件的字符编码是 UTF-8 并且行尾终止是 MS 样式。如果没有,请相应调整,或​​更新您的问题。

您可以像这样读取 UTF-8 字符的单个代码单元(与读取单个字符不同):

var ch: ansichar;
FileStream.ReadBuffer( ch, 1);

你可以像这样阅读一行文字......

function ReadLine( var Stream: TStream; var Line: string): boolean;
var
  RawLine: UTF8String;
  ch: AnsiChar;
begin
result := False;
ch := #0;
while (Stream.Read( ch, 1) = 1) and (ch <> #13) do
  begin
  result := True;
  RawLine := RawLine + ch
  end;
Line := RawLine;
if ch = #13 then
  begin
  result := True;
  if (Stream.Read( ch, 1) = 1) and (ch <> #10) then
    Stream.Seek(-1, soCurrent) // unread it if not LF character.
  end
end;

要读取第 2、3 和 4 行,假设位置在 0 ...

ReadLine( Stream, Line1);
ReadLine( Stream, Line2);
ReadLine( Stream, Line3);
ReadLine( Stream, Line4);
于 2012-07-22T07:14:33.413 回答
2

您可以使用传统的文件操作。要真正快速,您必须确保每行中的字节数相同。

Blockread、BlockWrite、Seek 是您可能会查看的关键字。

BlockRead 的示例页面

Seek 的示例页面

于 2012-07-23T08:51:42.227 回答
0

正如大卫解释的那样,由于 TFileStream.Read 的代码 Sean 建议很慢。但是如果你使用 TMemoryStream 而不是 TFileStream,那么慢的 Stream.Read 就不是那么重要了。在这种情况下,字符串操作会占用大部分时间。

如果您稍微更改代码,速度会提高 2 倍:

function ReadLine(Stream: TStream; var Line: string): boolean;
var
  ch: AnsiChar;
  StartPos, LineLen: integer;
begin
  result := False;
  StartPos := Stream.Position;
  ch := #0;
  while (Stream.Read( ch, 1) = 1) and (ch <> #13) do;
  LineLen := Stream.Position - StartPos;
  Stream.Position := StartPos;
  SetString(Line, NIL, LineLen);
  Stream.ReadBuffer(Line[1], LineLen);
  if ch = #13 then
    begin
    result := True;
    if (Stream.Read( ch, 1) = 1) and (ch <> #10) then
      Stream.Seek(-1, soCurrent) // unread it if not LF character.
    end
end;
于 2016-02-13T01:33:23.783 回答