0

这是页面的一个片段:

<tr id="product_34980" class="even">
<tr id="variant_100329" class="variantRow">

我想提取 34980 和 100329。可能有多个产品和变体。我将使用python。

谢谢

4

2 回答 2

0

@Kirill Polishchuk给出的链接是 SO 上的最爱,它清楚地说明了为什么你不应该为此使用正则表达式。

但是,如果您仍然坚持使用正则表达式,请尝试:

<tr[^>]*id="([^"]*)"[^>]*>

您的比赛现在在捕获组中#1

于 2013-10-16T01:47:40.600 回答
0
>>> p = re.compile('\d+')
>>> m = re.search(p, '<tr id="product_34980" class="even">')
>>> m.group()
'34980'
于 2013-10-16T02:01:13.423 回答