9

我想向应该以 .csv 文件响应的 HTTPS 站点发出发布请求。我有这个 Python 代码:

url = 'https://www.site.com/servlet/datadownload'
values = {
  'val1' : '123',
  'val2' : 'abc',
  'val3' : '1b3',
}

data = urllib.urlencode(values)
req = urllib2.Request(url,data)
response = urllib2.urlopen(req)
myfile = open('file.csv', 'wb')
shutil.copyfileobj(response.fp, myfile)
myfile.close()

但是'我得到了错误:

BadStatusLine: ''    (in httplib.py)

我已经尝试使用 Chrome 扩展程序发布请求:高级 REST 客户端(屏幕截图),效果很好。

可能是什么问题,我该如何解决?(是因为HTTPS吗?)


编辑,重构代码:

try:
    #conn = httplib.HTTPSConnection(host="www.site.com", port=443)

=> 给出一个BadStatusLine: ''错误

    conn = httplib.HTTPConnection("www.site.com");
    params  = urllib.urlencode({'val1':'123','val2':'abc','val3':'1b3'})
    conn.request("POST", "/nps/servlet/exportdatadownload", params)
    content = conn.getresponse()
    print content.reason, content.status
    print content.read()
    conn.close()
except:
    import sys
    print sys.exc_info()[:2]

输出:

Found 302

<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
<HTML><HEAD>
<TITLE>302 Found</TITLE>
</HEAD><BODY>
<H1>Found</H1>
The document has moved <A HREF="https://www.site.com/nps/servlet/exportdatadownload">here</A>.<P>
<HR>
<ADDRESS>Oracle-Application-Server-10g/10.1.3.5.0 Oracle-HTTP-Server Server at mp-www1.mrco.be Port 7778</ADDRESS>
</BODY></HTML>

我究竟做错了什么?

4

4 回答 4

13

有你必须使用的理由urllib吗?Requests更简单,几乎在所有方面都更好,并且抽象出一些urllib难以处理的杂乱无章的东西。

例如,我会将您的示例修改为:

import requests
resp = requests.post(url, data=values, allow_redirects=True)

此时,来自服务器的响应在 中可用resp.text,你可以用它做你想做的事。如果请求无法正确发布(例如,因为您需要自定义 SSL 证书),它应该会给您一个很好的错误消息,告诉您原因。

即使您不能在生产环境中执行此操作,也可以在本地 shell 中执行此操作以查看您从中获得的错误消息requests,并使用它来调试urllib

于 2013-03-04T23:51:38.097 回答
3

BadStatusLine: '' (in httplib.py)表明这里可能发生了其他事情。当服务器根本没有回复,只是关闭连接时,可能会发生这种情况。

正如您提到的,您正在使用 SSL 连接,这可能对调试特别有趣(curl -v URL如果您愿意的话)。如果您发现curl -2 URL(强制使用 SSLv2)似乎有效,而curl -3 URL(SSLv3) 无效,您可能需要查看 python bugtracker 上的问题#13636和可能的#11220。根据您的 Python 版本和可能配置错误的网络服务器,这可能会导致问题:SSL 默认值在 v2.7.3 中已更改。

于 2013-03-10T23:44:48.350 回答
1
   conn = httplib.HTTPSConnection(host='www.site.com', port=443, cert_file=_certfile)
   params  = urllib.urlencode({'cmd': 'token', 'device_id_st': 'AAAA-BBBB-CCCC',
                                'token_id_st':'DDDD-EEEE_FFFF', 'product_id':'Unit Test',
                                'product_ver':"1.6.3"})
    conn.request("POST", "servlet/datadownload", params)
    content = conn.getresponse().read()
    #print response.status, response.reason
    conn.close()
于 2013-01-17T20:55:30.593 回答
0

服务器可能不喜欢缺少的标头,尤其是用户代理和内容类型。Chrome 图像显示了用于这些的内容。也许尝试添加标题:

import httplib, urllib

host = 'www.site.com'
url = '/servlet/datadownload'

values = {
  'val1' : '123',
  'val2' : 'abc',
  'val3' : '1b3',
}

headers = {
    'User-Agent': 'python',
    'Content-Type': 'application/x-www-form-urlencoded',
}

values = urllib.urlencode(values)

conn = httplib.HTTPSConnection(host)
conn.request("POST", url, values, headers)
response = conn.getresponse()

data = response.read()

print 'Response: ', response.status, response.reason
print 'Data:'
print data

这是未经测试的代码,您可能希望通过添加其他标头值来匹配您的屏幕截图来进行试验。希望能帮助到你。

于 2013-03-09T22:36:59.610 回答