我在 python 中接收到类似于这种格式的数据
garbage
=== Season 1 ===
season 1 data
more season 1 data
=== Season 2 ===
season 2 data
使用换行符,但未定义“=== Season x ===”之间的数据(如果您知道,它来自维基百科的 API)。
无论如何,我正在尝试使用正则表达式将其分解,但似乎无法正确处理。我试试
p = re.compile('(===\sSeason.*)'
print p.split(data)
并得到
['garbarge\n', '=== Season 1 ===', '\nseason 1 data\nmore season 1 data\n\n', '=== Season 2 ===', '\nseason 2 data\n']
但我正在寻找的是:
['garbarge\n', '=== Season 1 ===\nseason 1 data\nmore season 1 data\n\n', '=== Season 2 ===\nseason 2 data\n']
每个模式包括文本,直到下一个模式,换行符和所有。我尝试过 re.MULTILINE、re.DOTALL 的组合,但我似乎无法做到正确。有什么帮助吗?