Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个非常大的文件——有些文件高达 10GB——主要包含结构化数据(例如,其中 99% 是我感兴趣的每一行文本的制表符分隔值)。我需要从这些文件中提取非常具体的数据,我可以通过正则表达式轻松找到这些数据。但是,我担心的是,如果我尝试将文件转换为字符串然后正则表达式该字符串,我会遇到各种问题。
正则表达式解析非常大的文件的好策略是什么?
逐行读取文件(fgets)并分块处理。