0

我正在制作一个 Java 应用程序来检查 XML 文件是否已经是规范的或不使用 XOM。

在我的测试中,我有以下已经是规范的文件。

<doc xmlns="http://example.com/default" xmlns:x="http://example.com/x">
  <a a1="1" a2="2">123</a>
  <b xmlns:y="http://example.com/y" a3="&quot;3&quot;" y:a1="1" y:a2="2"></b>
</doc>

这是我用 XOM 再次加载它时的代码。

<?xml version="1.0"?>
<doc xmlns="http://example.com/default" xmlns:x="http://example.com/x">
  <a a1="1" a2="2">123</a>
  <b xmlns:y="http://example.com/y" a3="&quot;3&quot;" y:a1="1" y:a2="2" />
</doc>

如您所见,它再次添​​加了 xml 标记并删除了结束标记</b>,因为标记 b 的值为空。我对 xml 版本标记没有任何问题,但是</b>当我从文件加载规范文档时,我不知道如何保留结束标记。

4

1 回答 1

3

看起来您正在使用XOM Serializer输出文档,您需要使用XOM Canonicalizer来输出您的 xml 文档并保持其规范

这给出了输出:

<?xml version="1.0" encoding="UTF-8"?>
<doc xmlns="http://example.com/default" xmlns:x="http://example.com/x">
    <a a1="1" a2="2">123</a>
    <b a3="&quot;3&quot;" y:a1="1" y:a2="2" xmlns:y="http://example.com/y"/>
</doc>

以下示例程序将使用XOM Canonicalizer将您的 XML Cannonically 输出到 System.out

package com.foo.bar.xom;

import java.io.IOException;

import nu.xom.Builder;
import nu.xom.canonical.Canonicalizer;
import nu.xom.Document;
import nu.xom.ParsingException;
import nu.xom.Serializer;
import nu.xom.ValidityException;

public class App
{
    public static void main(String[] args) throws ValidityException, ParsingException, IOException
    {
        Builder builder = new Builder();
        //Serializer serializer = new Serializer(System.out);
        Canonicalizer canonicalizer = new Canonicalizer(System.out, Canonicalizer.EXCLUSIVE_XML_CANONICALIZATION);
        //this assumes to your xml document is on the classpath in this package as my.xml
        Document input = builder.build(App.class.getResourceAsStream("my.xml"), null);
        //serializer.write(input);
        canonicalizer.write(input);

    }
}
于 2012-04-18T09:25:55.393 回答