使用 PRCE 正则表达式,我想捕获不同 apache 博客的每个字段。这些日志的结构类似于以下示例:
aaa bbb "cc c" ddd "eee" fff
每个字段由空格分隔。但是字段也可能包含空格,在这种情况下,它们在字段的开头和结尾用引号括起来(“cc c”)。不包含空格的字段在字段的开头和结尾也有引号(“eee”)。
结果应该有每个字段的捕获组,因此对于示例应该是: Group1: aaa Group2: bbb Group3: "cc c" Group4: ddd Group5: "eee" Group6: fff
我的问题是我想要一个万能的解决方案,例如带有量词 - 像这样: (?:((aa|bb|"cc"|dd)\s){1,})
但是这里的量词总是在 aaa 处重复。
非常感谢一个整洁、有效的解决方案。