我有一个巨大的文件,我需要从中获取特定条目的数据。文件结构为:
>Entry1.1
#size=1688
704 1 1 1 4
979 2 2 2 0
1220 1 1 1 4
1309 1 1 1 4
1316 1 1 1 4
1372 1 1 1 4
1374 1 1 1 4
1576 1 1 1 4
>Entry2.1
#size=6251
6110 3 1.5 0 2
6129 2 2 2 2
6136 1 1 1 4
6142 3 3 3 2
6143 4 4 4 1
6150 1 1 1 4
6152 1 1 1 4
>Entry3.2
#size=1777
AND SO ON-----------
我必须实现的是我需要提取某些条目的所有行(完整记录)。例如,我需要 Entry1.1 的记录,而不是使用条目名称 '>Entry1.1' 直到下一个 '>' 作为 REGEX 中的标记来提取其间的行。但我不知道如何构建如此复杂的 REGEX 表达式。一旦我有了这样的表达,我就会把它放在一个 FOR 循环中:
For entry in entrylist:
GET record from big_file
DO some processing
WRITE in result file
什么可能是正则表达式来执行特定条目的此类记录提取?有没有更多的pythonic方法来实现这一点?我会很感激你在这方面的帮助。
AK