0

有没有办法最好使用标准org.w3c.orgjavax.xmlAPI 来获取 XML 文档中使用的前缀/名称空间绑定?我知道前缀可以通过在包含的元素中重新定义,因此 API 也应该能够解释这一点。

我正在寻找一段代码,它将以某种序列化形式获取 XML 文档并返回Map<String, String>URI 名称绑定的前缀(加上 API 中的一些额外聪明之处,以解决封闭元素中的重新定义)。理想情况下,图书馆可能能够做一些更有趣的事情,例如识别/清除未使用的绑定,将重复的绑定移动到它们最近的共同祖先(而不是让它们在整个地方复制)等等。

4

1 回答 1

1

这是一个开始,使用Guava MultiMap

Document doc = ...;

Multimap<String, String> bindings = LinkedHashMultimap.create();
DocumentTraversal dt = (DocumentTraversal) doc;
NodeIterator i = dt.createNodeIterator(doc, NodeFilter.SHOW_ELEMENT,
        null, false);
Element element = (Element) i.nextNode();
while (element != null) {
    String prefix = element.getPrefix();
    if (prefix != null) {
        String uri = element.getNamespaceURI();
        bindings.put(prefix, uri);
    }
    element = (Element) i.nextNode();
}

这只会获取有效的绑定,并且不会绑定任何默认命名空间(当然可以修复)。绑定的重新定义将按文档顺序表示,但不按它们发生的深度表示。

我想这种方法的任何进一步改进取决于您的用例,例如,您需要更多信息来使重新定义的绑定变得有意义?

于 2013-08-22T15:39:50.843 回答