5

关于正则表达式的有点棘手的问题。我有这种模式的网址:

http://www.domain.com/img?res=high&refurl=http://www.ahother_domain.com/page/&imgurl=http://www.one_more.com/static/images/mercedes.jpg&w=640&h= 480

我怎样才能提取imgurl价值?

4

2 回答 2

5

看一眼urlparse

http://docs.python.org/2/library/urlparse.html

您可以轻松地将您的 URL 拆分为参数,然后提取您需要的任何内容。

例子:

import urlparse
url = "http://www.domain.com/img?res=high&refurl=http://www.ahother_domain.com/page/&imgurl=http://www.one_more.com/static/images/mercedes.jpg&w=640&h=480"
urlParams = urlparse.parse_qs(urlparse.urlparse(url).query)
urlInUrl = urlParams['imgurl']
print urlInUrl
于 2013-10-15T11:13:35.150 回答
3

此解决方案假定imgurl参数值始终后跟大小参数,例如&w=...

import re
re.findall('imgurl=([^&]+)&', url)
于 2013-10-15T11:13:57.357 回答