1

我对 python 正则表达式有疑问。结果在 regxe buddy 上似乎很好,但在 python 中失败了。

我必须匹配的一组数据是一个列表:

['  101  0.  0.\n',
 '  0.  100.\n',
 '  1.  98.5107805\n',
 '  2.  97.0464459\n',
 '  3.  95.6065328\n', ... ]

我必须从第二行开始获取所有数字。为此,我使用了:

pattern = compile(r'\s*(?P<raw_time>\d*\.?\d*)\s+(?P<raw_value>\d*\.\d*)')

一切都很好。我遍历列表并在“raw_time”中获取第一个值,在“raw_value”中获取每行的第二个值。然后我应该扩展这个术语来处理加权数据。

于是数据变成了:

['  101  0.  0.\n',
 '  0.  100.  1\n',
 '  1.  98.5107805  1\n',
 '  2.  97.0464459  1\n',
 '  3.  95.6065328  1\n', ... ]

我仍然只需要解析出两个第一个参数。所以我将模式更改为:

pattern = compile(r'\s*(?P<raw_time>\d*\.?\d*)\s+(?P<raw_value>\d*\.\d*).+')

除了 1 之外的所有行都可以正常工作。

在职的:

In [35]: pattern.search('1.  98.5107805  1\n').groupdict()
Out[35]: {'raw_time': '1.', 'raw_value': '98.5107805'}

在职的:

In [37]: pattern.search('  0.  100.  1\n').groupdict()
Out[37]: {'raw_time': '0.', 'raw_value': '100.'}

在职的:

在 [44] 中:pattern.search('1.98.5107805\n').groupdict() Out[44]: {'raw_time': '1.', 'raw_value': '98.510780'}

不工作:

In [46]: pattern.search('  0.  100.\n').groupdict()
Out[46]: {'raw_time': '', 'raw_value': '0.'}

我严重依赖正则表达式(当然,演示,但到目前为止它与 python 一致)。

建议?

tnx

4

1 回答 1

2

您添加的.+需要更改为.*

+运算符需要至少一个字符,而将*接受零个或多个。

于 2012-05-25T07:55:53.627 回答