3

我正在使用 Python Requests 包来编写一个简单的 rest 客户端。这是我的代码 -

r = requests.get(url, auth=(user, passwd), stream=True, verify=False)
print('headers: ')
pprint.pprint(r.headers)
print('status: ' + str(r.status_code))
print('text: ' + r.text)

这是输出 -

headers: 
    {'content-type': 'text/xml;charset=UTF-8',
     'date': 'Thu, 16 May 2013 03:26:06 GMT',
     'server': 'Apache-Coyote/1.1',
     'set-cookie': 'JSESSIONID=779FC39...5698; Path=/; Secure; HttpOnly',
     'transfer-encoding': 'chunked'}
status: 200

Traceback (most recent call last):
  File "C:\...\client.py", line 617, in _readinto_chunked
    chunk_left = self._read_next_chunk_size()
  File "C:\...\client.py", line 562, in _read_next_chunk_size
    return int(line, 16)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 0: invalid continuation byte

对该请求的响应是 XML。好像是分块的。有没有一种特殊的方法来读取分块响应?我想将整个 XML 响应放在一个字符串中。

4

1 回答 1

3

stream=True仅当您计划迭代响应的内容时才使用。如果您计划立即打印响应内容,那么stream=True不会给您带来任何性能优势。它只会推迟将内容加载到内存中,直到您调用r.textr.content然后将其加载到内存中。如果您想防止将整个内容加载到内存中,请检查以下内容。对于另一个问题,试试这个:

print('text:')
print(r.text)

或者

print('text: ' + r.content)

如果您使用的是 2.x,r.text则它是一个 unicode 对象,可能无法转换为 ASCII。

我不太确定为什么没有 分块响应就无法工作stream=True,但是正确使用它的唯一方法(不像使用r.contentor那样一次下载所有内容r.text)是使用iter_contentor iter_lines。要将所有响应内容收集到一个字符串中,您可以执行以下操作:

contents = ''.join(r.iter_content(224))  # stole the number from your comment

关于相关说明:decode对返回的字符串使用该方法将提供高度不一致的结果。如果您的 API 允许它发送Accept-Encoding标头,那么您始终可以确保取回可以解码的数据。

您还没有这样做,所以我不建议这样做,但如果您坚持打印信息,那么您将需要它,特别是如果它是国际流行网站的 API。

于 2013-05-16T22:51:24.850 回答