3

我有一个像

href="../job/jobarea.asp?C_jobtype=经营管理资源&人数=151" ,

这显示在检查元素中。但是当在新标签中打开时,它显示为

../job/jobarea.asp?C_jobtype=%B8g%C0%E7%BA%DE%B2z%A5D%BA%DE&peoplenumber=151

我怎么知道浏览器使用哪种类型的编码来转换它。当我尝试做scrapy时,它显示了一些其他格式,并且由于500内部服务器错误而停止。你能解释一下吗?

4

1 回答 1

3

这是繁体中文,所以试试cp950

#-*-coding:utf8 -*-

import urllib
s = '經營管理主管'.decode('utf-8').encode('cp950')
print urllib.quote(s)

q ='%B8g%C0%E7%BA%DE%B2z%A5D%BA%DE'
print urllib.unquote(q).decode('cp950').encode('utf-8')

结果

%B8g%C0%E7%BA%DE%B2z%A5D%BA%DE
經營管理主管
于 2015-04-07T08:17:34.200 回答