1

直接来自 python 请求示例是这个片段:

payload = {'key1': 'value1', 'key2': 'value2'}  
r = requests.get("http://httpbin.org/get", params=payload)  
print r.url  
u'http://httpbin.org/get?key2=value2&key1=value1'

但是当我尝试从网站中提取数据时(使用请求 0.13.0):

payload = {'one' : 'one', 'two' : 'two' }  
r = requests.get("http://[ip_removed]/clubs/pairs_results/personal.php", params=payload)
print r.url  
http://[ip_removed]/clubs/pairs_results/

那根本没有正确编码。想法?

编辑:看起来该站点发出 302 重定向。我该如何处理以获得与我的浏览器将看到的相同的 html。

4

1 回答 1

4

该站点仅在HTTP 302此处执行 -redirect 操作requests,因此您最终将访问与最初请求不同的 url。这不是错误,而是预期的行为。

如果您不希望这样,您可以allow_redirects=False在发送请求时添加关键字参数。

顺便说一句:即使您删除了 IP,Google 搜索inurl:...也会快速显示您在此处谈论的网站...

于 2012-05-30T11:48:31.673 回答