python - ElementTree 命名空间不便

Question

我无法控制我得到的 XML 的质量。在某些情况下，它是：

<COLLADA xmlns="http://www.collada.org/2005/11/COLLADASchema" version="1.4.1">
...
</COLLADA>

在其他我得到：

 <COLLADA>...</COLLADA>

我想我也应该处理

 <collada:COLLADA xmlns:collada="http://www.collada.org/2005/11/COLLADASchema">
 ...
 </collada:COLLADA>

整个架构都是相同的，我只需要一个解析器来处理它。我该如何处理所有这些情况？我需要 XPath 和其他 lxml 好东西来解决这个问题。如何在 etree.parse 期间使其保持一致？我不想在每次需要使用 XPath 时检查名称空间。

score 1 · Accepted Answer

我通常的建议是先对其进行预处理，以规范命名空间。这有两个好处：规范化代码高度可重用，因为它不依赖于随后如何处理数据；并且处理数据的逻辑被大大简化了。

如果文档只使用这一个命名空间，或者没有，并且在文本或属性节点的内容中不使用限定名称，那么实现这种规范化的转换非常简单：

<xsl:template match="*">
  <xsl:element name="local-name()" namespace="http://www.collada.org/2005/11/COLLADASchema">
    <xsl:copy-of select="@*"/>
    <xsl:apply-templates/>
  </xsl:element>
</xsl:template>

python - ElementTree 命名空间不便

1 回答 1

Related

Reference