我的想法是探索 Groupon 的网站以提取交易的 url。问题是我正在尝试在 Groupon 的页面上进行查找以查找如下数据:(此页面的:http: //www.groupon.de/alle-deals/muenchen/restaurant-296)
"category":"RESTAURANT1","dealPermaLink":"/deals/muenchen-special/Casa-Lavecchia/24788330", and I'd like to get the 'deals/muenchen-special/Casa-Lavecchia/24788330'.
我尝试了整个晚上,但我找不到正确的正则表达式。我试过了:
import urllib2
import re
Page_Web = urllib2.urlopen('http://www.groupon.de/alle-deals/muenchen/restaurant-296').read()
for m in re.findall('category*RESATAURANT1*dealPermaLink*:?/*/*/*/*\d$',Page_Web):
print m
但它不打印任何东西。