xml - 尝试使用 lxml 解析时出现段错误

Question

我有这个简单的 python 脚本，它是这样的：

import sys 
from lxml import etree

tree = etree.parse('gdpdefl.xml')

但它有段错误，所以，经过一番谷歌搜索，我认为我的 xml 文档可能已损坏，所以我尝试了这个：

import sys
from lxml import etree

parser = etree.HTMLParser()
tree = etree.parse('gdpdefl.xml', parser)

这也是段错误。这是我要解析的 xml 文档的示例：

<?xml version="1.0" encoding="utf-8"?> <Root xmlns:wb="http://www.worldbank.org">   <data>
    <record>
      <field name="Country or Area" key="ARB">Arab World</field>
      <field name="Item" key="NY.GDP.DEFL.KD.ZG">Inflation, GDP deflator (annual %)</field>
      <field name="Year">1960</field>
      <field name="Value" />
    </record>
    <record>
      <field name="Country or Area" key="ARB">Arab World</field>
      <field name="Item" key="NY.GDP.DEFL.KD.ZG">Inflation, GDP deflator (annual %)</field>
      <field name="Year">1961</field>
      <field name="Value" />
    </record> 
    <record>
      <field name="Country or Area" key="ZWE">Zimbabwe</field>
      <field name="Item" key="NY.GDP.DEFL.KD.ZG">Inflation, GDP deflator (annual %)</field>
      <field name="Year">2011</field>
      <field name="Value">21.1562931758805</field>
    </record>
  </data>
</Root>

如果我在这里的 xml 格式不正确，那么将所有 Country、Item、Year 和 Values 字符串从该文件中取出并放入列表的最佳方法是什么？

xml - 尝试使用 lxml 解析时出现段错误

0 回答 0

Related

Reference