我有这样的数据文件:
group Head:
data1: abc data2: def
2word data3: ghi data4: jkl
data3: mno three word data4: pqr stu
所以在python中我建立了一个像这样的正则表达式:
Data = re.findall(r'(([\w\(\)]+[ \t\f]?)+):([ \t\f]*(\S+))', data)
我的文件接近 600 行,通常有 2 列,如上所示,每个文件解析它们需要几分钟。
使此代码更高效以便每个文件在不到 10 秒内运行的最佳方法是什么?