python - 无法用 python 读取这个 xml？

Question

我对 xhtml 几乎一无所知。而且我必须编写一个 python 脚本来编辑一个表。但是由于某种原因，我必须编辑的 wiki 页面没有被任何 python xml 解析器读取，而且我不知道发生了什么。这是 wiki 的示例页面。谁能告诉我这到底是怎么回事？

<h2>test</h2><p>&nbsp;</p><p><strong>I am a test</strong></p><p>&nbsp;</p><p>Now I need a table</p><table>
<tbody>
<tr>
    <th>name</th>
    <th>column</th>
</tr>
<tr>
    <td>data1</td>
    <td><p>data2</p></td>
</tr>
</tbody>
</table><p>&nbsp;</p><p>&nbsp;</p>

这是我一直在尝试阅读的一些代码。我经历了几次迭代和不同的 xml 解析器、pulldom、xml.dom、ElementTree、minidom 等。它们都给出了相同的异常：

from xml.etree import ElementTree as ET
def main( argv ):
    fileName = "/home/robbnic/Source/scripts/Gesture Service Dashboard.txt"
    text = readFromFile(fileName)
    try:
        for event, elem in ET.iterparse(fileName):
            if elem.tag == "table":
                print "Hot damn!"
                elem.clear()
    except ET.ParseError as pe:
         print pe.message
         print pe.msg
         print pe.args
         print pe.filename
    except:
         print "Unexpected error:", sys.exc_info()[0]
         raise

我不断收到的异常错误是未绑定前缀，但我对 xml（或本例中的 xhtml）知之甚少，以至于我不知道发生了什么。

score 2 · Accepted Answer

2

您缺少一个根标签。您不能像您的那样有多个根（即h2、ps table、等）。

于 2012-07-20T03:23:35.620 回答

python - 无法用 python 读取这个 xml？

1 回答 1

Related

Reference