2

我正在使用 python 运行一个烧瓶应用程序,其中一部分使用从第三方 API 检索的 XML 数据。我使用 minidom 来解析 python 脚本中的 XML。

相关python代码:

from xml.dom import minidom
import requests

usa_xml = requests.get(URL_HERE)
usa_parsed = minidom.parseString(usa_xml.content)

该脚本继续定位和显示 XML 中的值。在我的本地机器上运行 python 脚本,一切正常。在pythonanywhere上建立了一个存储库后,解析失败并使用相同的 XML 数据。

错误回溯:

Traceback (most recent call last):
  File "/usr/local/lib/python3.4/dist-packages/flask/app.py", line 1817, in wsgi_app
    response = self.full_dispatch_request()
  File "/usr/local/lib/python3.4/dist-packages/flask/app.py", line 1477, in full_dispatch_request
    rv = self.handle_user_exception(e)
  File "/usr/local/lib/python3.4/dist-packages/flask/app.py", line 1381, in handle_user_exception
    reraise(exc_type, exc_value, tb)
  File "/usr/local/lib/python3.4/dist-packages/flask/_compat.py", line 33, in reraise
    raise value
  File "/usr/local/lib/python3.4/dist-packages/flask/app.py", line 1475, in full_dispatch_request
    rv = self.dispatch_request()
  File "/usr/local/lib/python3.4/dist-packages/flask/app.py", line 1461, in dispatch_request
    return self.view_functions[rule.endpoint](**req.view_args)
  File "/home/jshorty/OwlWire/owlwire.py", line 65, in select
    usa_parsed = minidom.parseString(usa_xml.content)
  File "/usr/lib/python3.4/xml/dom/minidom.py", line 1970, in parseString
    return expatbuilder.parseString(string)
  File "/usr/lib/python3.4/xml/dom/expatbuilder.py", line 925, in parseString
    return builder.parseString(string)
  File "/usr/lib/python3.4/xml/dom/expatbuilder.py", line 223, in parseString
    parser.Parse(string, True)
xml.parsers.expat.ExpatError: no element found: line 29, column 7    

由于它使用与其他方式相同的 XML 失败,因此这似乎不是 XML 本身的问题。我不知道从哪里开始寻找问题 - 我正在使用 pythonanywhere 上预安装的所有默认模块,这可能是不同版本的 minidom 的问题吗?

错误总是在第 29 行第 7 列,所以这里是我正在访问的 XML 的一个实例的链接: http ://ebird.org/ws1.1/data/obs/region_spp/recent?rtype=country&r =US&sci=surnia%20ulula&back=30&maxResults=1&includeProvisional=true

4

1 回答 1

3

我的猜测是您使用的是免费帐户。PythonAnywhere 上的免费帐户限制了 Internet 访问,您只能访问白名单上的站点:

https://www.pythonanywhere.com/wiki/403ForbiddenError

https://www.pythonanywhere.com/whitelist/

如果您调整代码以执行以下操作,您会看到:

usa_xml = requests.get(URL_HERE)
print(usa_xml)

你可能会看到一个

<Response [403]> 

403被禁止。

我们(PythonAnywhere 团队)通常很乐意将具有公共 API 的站点添加到白名单中。ebird.com 看起来不错,我会看看是否可以添加它。对于其他有类似要求的人,如果您看到 403,请随时与我们联系!

于 2014-07-08T14:56:17.813 回答