这是页面的一个片段:
<tr id="product_34980" class="even">
<tr id="variant_100329" class="variantRow">
我想提取 34980 和 100329。可能有多个产品和变体。我将使用python。
谢谢
这是页面的一个片段:
<tr id="product_34980" class="even">
<tr id="variant_100329" class="variantRow">
我想提取 34980 和 100329。可能有多个产品和变体。我将使用python。
谢谢
@Kirill Polishchuk给出的链接是 SO 上的最爱,它清楚地说明了为什么你不应该为此使用正则表达式。
但是,如果您仍然坚持使用正则表达式,请尝试:
<tr[^>]*id="([^"]*)"[^>]*>
您的比赛现在在捕获组中#1
>>> p = re.compile('\d+')
>>> m = re.search(p, '<tr id="product_34980" class="even">')
>>> m.group()
'34980'