我有一个关于使用 python 处理跟踪文件的问题(它包含十亿行数据)。
我想要做的是,程序会在文件中找到一个特定的行(比如说它是 line#x),它需要从文件中的这个(line#x)中找到另一个符号。找到该行后,再次从 (line# x) 开始搜索另一行。
我现在所做的如下,但问题是它总是需要重新打开文件并从头开始读取以找到匹配的文件(行#> x,并包含我想要的符号)。对于一个大的跟踪文件,处理时间太长。
1.
for line in file.readlines()
i++ #update the line number
if i > x:
if (line.find()):
或者:
for i, line in enumerate(open(file)):
if i > x:
if ....
任何人都可以给我一个关于更好想法的提示吗?
谢谢