我正在解析一个 20Gb 文件并将满足特定条件的行输出到另一个文件,但是偶尔 python 会一次读取 2 行并将它们连接起来。
inputFileHandle = open(inputFileName, 'r')
row = 0
for line in inputFileHandle:
row = row + 1
if line_meets_condition:
outputFileHandle.write(line)
else:
lstIgnoredRows.append(row)
我检查了源文件中的行尾,它们作为换行符签出(ascii char 10)。提取问题行并单独解析它们可以按预期工作。我在这里遇到了一些 python 限制吗?第一个异常在文件中的位置在 4GB 标记附近。