0

我收到了这个错误,说格式不正确,它与 xml 本身有关。我如何告诉 python 忽略 xml 文件的一部分?

    <?xml version="1.0"?>
    <solution version="0.1" run date = "2013-04-01">
        <description />
        <drillholes total_holes="302" total_drilhole_cost="6190">

那是文件的开头,错误发生在运行日期 = 等等等等,我如何让 python 在不删除代码的情况下忽略该部分,谢谢

4

2 回答 2

0

您的代码不是格式良好的 XML 文件。应该是这样的:

-第一:你总是需要一个根对象(在你的情况下,这是<solution>第二:你总是必须关闭每个打开的标签,第三:你不能在属性名称中使用空格(在你的情况下:run date)。

<?xml version="1.0"?>
<solution version="0.1" run_date="2013-04-01">
    <description />
    <drillholes total_holes="302" total_drilhole_cost="6190" />
</solution>

编辑:

您唯一的问题是属性名称。你必须解决这个问题,然后一切都会好起来的。

于 2013-05-25T17:38:22.833 回答
0

未良好形成仍然未良好形成。每个 XML 解析器都会抱怨您的文件。如果您没有有效的 XML,则不要使用 XML 解析器。这个案子很清楚。如果你想解析你的垃圾格式,那么使用 BeautifulSoup 之类的东西或编写你自己的垃圾数据感知解析器。讨论完毕。

于 2013-05-25T17:46:06.083 回答