我对 xhtml 几乎一无所知。而且我必须编写一个 python 脚本来编辑一个表。但是由于某种原因,我必须编辑的 wiki 页面没有被任何 python xml 解析器读取,而且我不知道发生了什么。这是 wiki 的示例页面。谁能告诉我这到底是怎么回事?
<h2>test</h2><p> </p><p><strong>I am a test</strong></p><p> </p><p>Now I need a table</p><table>
<tbody>
<tr>
<th>name</th>
<th>column</th>
</tr>
<tr>
<td>data1</td>
<td><p>data2</p></td>
</tr>
</tbody>
</table><p> </p><p> </p>
这是我一直在尝试阅读的一些代码。我经历了几次迭代和不同的 xml 解析器、pulldom、xml.dom、ElementTree、minidom 等。它们都给出了相同的异常:
from xml.etree import ElementTree as ET
def main( argv ):
fileName = "/home/robbnic/Source/scripts/Gesture Service Dashboard.txt"
text = readFromFile(fileName)
try:
for event, elem in ET.iterparse(fileName):
if elem.tag == "table":
print "Hot damn!"
elem.clear()
except ET.ParseError as pe:
print pe.message
print pe.msg
print pe.args
print pe.filename
except:
print "Unexpected error:", sys.exc_info()[0]
raise
我不断收到的异常错误是未绑定前缀,但我对 xml(或本例中的 xhtml)知之甚少,以至于我不知道发生了什么。