我有这样的链接:
<div class="zg_title">
<a href="https://rads.stackoverflow.com/amzn/click/com/B000O3GCFU" rel="nofollow noreferrer">Thermos Foogo Leak-Proof Stainless St...</a>
</div>
我像这样刮他们:
product_asin = product.xpath('//div[@class="zg_title"]/a/@href').first.value
问题是它需要整个 URL,我只想获取 ID:
B000O3GCFU
我想我需要做这样的事情:
product_asin = product.xpath('//div[@class="zg_title"]/a/@href').first.value[ReGEX_HERE]
在这种情况下我可以使用的最简单的正则表达式是什么?
编辑:
奇怪的链接 URL 似乎不完整:
http://www.amazon.com/Thermos-Foogo-Leak-Proof-Stainless-10-Ounce/dp/B000O3GCFU/ref=zg_bs_baby-products_1