我想解析一个看起来像这样的文件:
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
HEADER
body
body
body
FOOTER
BLABLABLABLA
BLABLABLABLA
BLABLABLABLA
我想提取 HEADER 和 FOOTER 之间存在的内容。每个 HEADER 和 FOOTER 之间的行数可以变化,内容本身也可以变化,我编写了以下代码来提取它:
fd=open(file,"r")
for line in fd:
if not start_flag:
match = re.search(r'.*HEADER.*',line)
if not match:
continue
else:
body=body+line+"\n"
start_flag=True
else:
match_end = re.search(r'.*FOOTER.*',line)
if not match_end:
body=body+line+"\n"
continue
else:
body=body+line+"\n\n"
break
print body
这是使用 python 从文件中提取内容的最佳方法吗?解决此类问题的其他方法是什么?