我有一个巨大的文本文件(1 GB),其中每个“行”由## 分隔。
例如:
## sentence 1 ## sentence 2
## sentence 3
我正在尝试根据## 分隔打印文件。
我尝试了以下代码,但 read() 函数粉碎(因为文件的大小)。
import re
dataFile = open('post.txt', 'r')
p = re.compile('##(.+)')
iterator = p.finditer(dataFile.read())
for match in iterator:
print (match.group())
dataFile.close()
有任何想法吗?