关于正则表达式的有点棘手的问题。我有这种模式的网址:
我怎样才能提取imgurl
价值?
关于正则表达式的有点棘手的问题。我有这种模式的网址:
我怎样才能提取imgurl
价值?
看一眼urlparse
http://docs.python.org/2/library/urlparse.html
您可以轻松地将您的 URL 拆分为参数,然后提取您需要的任何内容。
例子:
import urlparse
url = "http://www.domain.com/img?res=high&refurl=http://www.ahother_domain.com/page/&imgurl=http://www.one_more.com/static/images/mercedes.jpg&w=640&h=480"
urlParams = urlparse.parse_qs(urlparse.urlparse(url).query)
urlInUrl = urlParams['imgurl']
print urlInUrl
此解决方案假定imgurl
参数值始终后跟大小参数,例如&w=...
:
import re
re.findall('imgurl=([^&]+)&', url)