我需要 Pythonists 的帮助:我正在抓取所有以“details.php”开头的 url?从此页面并忽略所有其他网址。
然后我需要将我刚刚抓取的每个 url 转换为绝对 url,这样我就可以一个一个地抓取它们。绝对网址以:http ://evenementen.uitslagen.nl/2013/marathonrotterdam/details.php 开头?...
我试过re.findall
这样使用:
html = scraperwiki.scrape(url)
if html is not None:
endofurl = re.findall("details.php?(.*?)>", html)
这给了我一个清单,但后来我被卡住了。有人可以帮帮我吗?