python - urlparse 的奇怪行为

Question

我想知道我在 python 的 urlparse 中看到的一些奇怪行为是否有已知的解决方法。

以下是 python interpeter 中几行的一些结果：

>>> import urlparse
>>> urlparse.parse_qsl('https://localhost/?code=bork&charlie=brown')
[('https://localhost/?code', 'bork'), ('charlie', 'brown')]

在上面的例子中，为什么第一个值的键是“https://localhost/?code”？它不应该只是“代码”吗？注意： parse_qs 具有相同的不良行为。

>>> urlparse.urlparse('abcd://location/?code=bork&charlie=brown')
ParseResult(scheme='abcd', netloc='location', path='/?code=bork&charlie=brown', params='', query='', fragment='')
>>> urlparse.urlparse('https://location/?code=bork&charlie=brown')
ParseResult(scheme='https', netloc='location', path='/', params='', query='code=bork&charlie=brown', fragment='')

在上面的示例中，请注意查询字符串并不总是被放入查询值中。为什么协议很重要？查询字段不应该总是得到查询字符串吗？使用“ftp”或其他众所周知的协议进行测试似乎也令人不快。

score 3 · Accepted Answer

urlparse.parse_qsl(and urlparse.parse_qs) 是用于请求的查询部分的方法（后面的字符串?）。

也许您想使用一种首先了解整个 URL 的方法 ( urlparse.urlparse)，然后将查询从结果传递到urlparse_qsl：

>>> import urlparse
>>> myurl = urlparse.urlparse('https://localhost/?code=bork&charlie=brown')
>>> print myurl
ParseResult(scheme='https', netloc='localhost', path='/', params='', query='code=bork&charlie=brown', fragment='')
>>> print myurl.scheme
https
>>> print urlparse.parse_qs(myurl.query)
{'charlie': ['brown'], 'code': ['bork']}

该方案很重要，因为尽管查询存在于通用语法中，但某些协议可能不支持它们。

也可以看看：

http://en.wikipedia.org/wiki/URI_scheme（查看官方注册方案）

score 0 · Accepted Answer

urlparse.parse_qs(and )的文档parse_qsl确实声明它是为了“解析作为字符串参数给出的查询字符串”。您不是给它一个查询字符串，而是给它整个 URL。试试这个：

>>> urlparse.parse_qsl('code=bork&charlie=brown')
[('code', 'bork'), ('charlie', 'brown')]

python - urlparse 的奇怪行为

2 回答 2

Related

Reference