0

我有一个非常大的文件——有些文件高达 10GB——主要包含结构化数据(例如,其中 99% 是我感兴趣的每一行文本的制表符分隔值)。我需要从这些文件中提取非常具体的数据,我可以通过正则表达式轻松找到这些数据。但是,我担心的是,如果我尝试将文件转换为字符串然后正则表达式该字符串,我会遇到各种问题。

正则表达式解析非常大的文件的好策略是什么?

4

1 回答 1

5

逐行读取文件(fgets)并分块处理。

于 2013-09-23T08:57:39.263 回答