python - Python：拆分包含括号和|的复杂字符串

Question

在测试文件中，我有表格中的记录

DATA(VALUE1|VALUE2||VALUE4)

等等。

我想将此字符串拆分为两次，第一次产生“DATA”，第二次给出括号内的内容，在“|”处拆分。第二部分看起来微不足道，但到目前为止，我在第一部分的尝试是丑陋的。

我更倾向于正则表达式而不是解析，因为最终行非常简单。

score 6 · Accepted Answer

另一个建议：

>>> s = "DATA(VALUE1|VALUE2||VALUE4)"
>>> import re
>>> matches = re.findall("[^()]+", s)
>>> matches
['DATA', 'VALUE1|VALUE2||VALUE4']
>>> result = {matches[0]: matches[1].split("|")}
>>> result
{'DATA': ['VALUE1', 'VALUE2', '', 'VALUE4']}

score 5 · Accepted Answer

您可以通过以下方式一次性完成re.split：

In [10]: import re

In [11]: line = 'DATA(VALUE1|VALUE2||VALUE4)'

In [12]: re.split(r'[(|)]', line)
Out[12]: ['DATA', 'VALUE1', 'VALUE2', '', 'VALUE4', '']

并像这样提取数据和值：

In [13]: parts = re.split(r'[(|)]', line)

In [14]: data = parts[0]

In [15]: values = parts[1:-1]

In [16]: values
Out[16]: ['VALUE1', 'VALUE2', '', 'VALUE4']

score 1 · Accepted Answer

import re
s = 'DATA(VALUE1|VALUE2|VALUE4)'

然后

re.search(r"(.*)\((.*)\)", s).group(2).split("|")

给你

['VALUE1', 'VALUE2', 'VALUE4']

和

re.search(r"(.*)\((.*)\)", s).group(1)

给你

'DATA'

python - Python：拆分包含括号和|的复杂字符串

3 回答 3

Related

Reference