您好我正在尝试使用 RegEx 将日志文件拆分为稍后进入数据库的组。出于某种原因,我无法让最后一组包含字符串的最后一个单词和换行符。
我正在解析的日志文件如下所示:
12:00:01 GRP this is a test1
12:02:03 TES here something else has happend
12:32:22 MCH This processe is finished
我想把它们分成三组
Time
3-letter code
Text
目前在Python中我正在使用这个:
def parse (s):
mO = re.search ('([0-9][0-9]:[0-9][0-9]:[0-9][0-9]) (\w*) (\w.+) ',s)
if mO:
print "1: "+mO.group(1)
print "2: "+mO.group(2)
print "3: "+mO.group(3)
我得到的结果是:
1: 12:00:01
2: GRP
3: this is a
1: 12:02:03
2: TES
3: here something else has
1: 12:32:22
2: MCH
3: This processe is
不断丢失新行附加到的字符串中的最后一个单词。我尝试在所有变体中添加 \n\r 但经过 1 天的搜索完全丢失。
非常感谢任何帮助。