0

我对 xhtml 几乎一无所知。而且我必须编写一个 python 脚本来编辑一个表。但是由于某种原因,我必须编辑的 wiki 页面没有被任何 python xml 解析器读取,而且我不知道发生了什么。这是 wiki 的示例页面。谁能告诉我这到底是怎么回事?

<h2>test</h2><p>&nbsp;</p><p><strong>I am a test</strong></p><p>&nbsp;</p><p>Now I need a table</p><table>
<tbody>
<tr>
    <th>name</th>
    <th>column</th>
</tr>
<tr>
    <td>data1</td>
    <td><p>data2</p></td>
</tr>
</tbody>
</table><p>&nbsp;</p><p>&nbsp;</p>

这是我一直在尝试阅读的一些代码。我经历了几次迭代和不同的 xml 解析器、pulldom、xml.dom、ElementTree、minidom 等。它们都给出了相同的异常:

from xml.etree import ElementTree as ET
def main( argv ):
    fileName = "/home/robbnic/Source/scripts/Gesture Service Dashboard.txt"
    text = readFromFile(fileName)
    try:
        for event, elem in ET.iterparse(fileName):
            if elem.tag == "table":
                print "Hot damn!"
                elem.clear()
    except ET.ParseError as pe:
         print pe.message
         print pe.msg
         print pe.args
         print pe.filename
    except:
         print "Unexpected error:", sys.exc_info()[0]
         raise

我不断收到的异常错误是未绑定前缀,但我对 xml(或本例中的 xhtml)知之甚少,以至于我不知道发生了什么。

4

1 回答 1

2

您缺少一个根标签。您不能像您的那样有多个根(即h2ps table、 等)。

于 2012-07-20T03:23:35.620 回答