2

我无法始终从给定的 url 获取 JSON。它仅在大约 60% 的时间内有效

jsonurl = urlopen('http://www.reddit.com/r/funny/hot.json?limit=16')
r_content = json.load(jsonurl)['data']['children']

程序有时会在第二行崩溃,因为由于某种原因无法正确检索来自 url 的信息

通过一些调试,我发现我从第一行收到以下错误:

<addinfourl at 4321460952 whose fp = <socket._fileobject object at 0x10185b050>>

这个错误大约有 40% 的时间发生,另外 60% 的时间,代码运行良好。我究竟做错了什么?如何使网址打开更加一致?

4

1 回答 1

1

这通常不是客户端的问题。您的代码在行为上是一致的,但服务器响应可能会有所不同。

我运行了您的代码几次,它确实引发了某些问题:

>>> jsonurl = urlopen('http://www.reddit.com/r/funny/hot.json?limit=16')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib2.py", line 126, in urlopen
    return _opener.open(url, data, timeout)
  File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib2.py", line 406, in open
    response = meth(req, response)
  File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib2.py", line 519, in http_response
    'http', request, response, code, msg, hdrs)
  File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib2.py", line 444, in error
    return self._call_chain(*args)
  File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib2.py", line 378, in _call_chain
    result = func(*args)
  File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib2.py", line 527, in http_error_default
    raise HTTPError(req.get_full_url(), code, msg, hdrs, fp)
urllib2.HTTPError: HTTP Error 429: Unknown

您必须处理服务器响应不是 HTTP 200 的情况。您可以将代码包装在try/except块中,并且jsonurl只有在请求成功时才应传递给 json.loads()。

urlopen 还返回一个类似文件的描述符。因此,如果你print jsourl,它只是提供jsonurl.__repr__()价值。见下文:

>>> jsonurl.__repr__()
'<addinfourl at 4393153672 whose fp = <socket._fileobject object at 0x105978450>>'

您必须寻找以下内容::

>>> jsonurl.getcode()
200
>>> 

并且仅当它为 200 时,您才应该处理从请求中获得的数据。

于 2013-07-05T05:48:26.403 回答