11

有没有更简洁的方法来修改 Python 2 中 URL 的某些部分?

例如

http://foo/bar -> http://foo/yah

目前,我正在这样做:

import urlparse

url = 'http://foo/bar'

# Modify path component of URL from 'bar' to 'yah'
# Use nasty convert-to-list hack due to urlparse.ParseResult being immutable
parts = list(urlparse.urlparse(url))
parts[2] = 'yah'

url = urlparse.urlunparse(parts)

有更清洁的解决方案吗?

4

2 回答 2

24

不幸的是,文档已经过时了;urlparse.urlparse()(and )产生的结果urlparse.urlsplit()使用collections.namedtuple()-produced 类作为基础。

不要将此命名元组转换为列表,而是使用为此任务提供的实用方法:

parts = urlparse.urlparse(url)
parts = parts._replace(path='yah')

url = parts.geturl()

namedtuple._replace()方法允许您创建一个替换特定元素的新副本。然后,该ParseResult.geturl()方法将这些部分重新加入到您的 url 中。

演示:

>>> import urlparse
>>> url = 'http://foo/bar'
>>> parts = urlparse.urlparse(url)
>>> parts = parts._replace(path='yah')
>>> parts.geturl()
'http://foo/yah'

mgilson提交了一份错误报告(带有补丁)以解决文档问题。

于 2014-06-13T08:35:40.200 回答
-1

I guess the proper way to do it is this way.

As using _replace private methods or variables is not suggested.

from urlparse import urlparse, urlunparse

res = urlparse('http://www.goog.com:80/this/is/path/;param=paramval?q=val&foo=bar#hash')
l_res = list(res)
# this willhave ['http', 'www.goog.com:80', '/this/is/path/', 'param=paramval', 'q=val&foo=bar', 'hash']
l_res[2] = '/new/path'
urlunparse(l_res)
# outputs 'http://www.goog.com:80/new/path;param=paramval?q=val&foo=bar#hash'
于 2017-08-24T07:33:34.097 回答