我有一组文件大小非常大的文本文件。我不想阅读整个文件。我只对以 . 开头** DATA IMP
和结尾的块感兴趣** DATA END
。这个块之间的任何数据对我来说都很重要。
但是,此块可能出现在文件的 开头、结尾或文本文件之间。我希望这个阅读过程更快。假设它是在文本文件的开头,它应该和 linux -head 一样快,这对于大文件花费的时间要少得多。
读取这些大文件的最佳方法是什么,所以一旦我得到这个块,我就不必读取文件直到结束?
文件内容示例:(600 MB 或更大)
Dummy text
Dummy text
Dummy text
Dummy text
** DATA IMP
** d
** e
** f
** g
** DATA END
Dummy text
Dummy text
Dummy text
AND SO ON ...
编辑: *好的。我假设数据位于文件顶部,因为我没有其他选项。* 文件内容示例:(600 MB 或更大)
** DATA IMP
** d
** e
** f
** g
** DATA END
Dummy text
Dummy text
Dummy text
Dummy text
Dummy text
Dummy text
AND SO ON ...