1

我有一种情况,我们想要验证作为字节流保存在内存中的 XML 文档,而不是放置在文件系统中的 XSD。我们希望避免在 XML 文件中明确提及文件名,而是告诉 XML 解析器使用一个或多个 XSD 文件的目录进行验证。

我尝试创建 DocumentBuilder 提供程序(用于 Guice 3.0)如下所示:

public class ValidatingDocumentBuilderProvider implements
        Provider<DocumentBuilder> {

    static final String JAXP_SCHEMA_LANGUAGE = "http://java.sun.com/xml/jaxp/properties/schemaLanguage";
    static final String W3C_XML_SCHEMA = "http://www.w3.org/2001/XMLSchema";
    static final String JAXP_SCHEMA_SOURCE = "http://java.sun.com/xml/jaxp/properties/schemaSource";

    Logger log = getLogger(ValidatingDocumentBuilderProvider.class);

    DocumentBuilderFactory dbf;

    public synchronized DocumentBuilder get() { // dbf not thread-safe

        if (dbf == null) {
            log.debug("Setting up DocumentBuilderFactory");

            // http://download.oracle.com/javaee/1.4/tutorial/doc/JAXPDOM8.html
            dbf = DocumentBuilderFactory.newInstance();
            dbf.setNamespaceAware(true);
            dbf.setValidating(true);
            dbf.setAttribute(JAXP_SCHEMA_LANGUAGE, W3C_XML_SCHEMA);
            // parser should look for schema reference in xml file

            // Find XSD's in current directory.

            FilenameFilter fileNameFilter = new FilenameFilter() {

                public boolean accept(File dir, String name) {
                    return name.toLowerCase().endsWith(".xsd");
                }
            };
            File[] schemaFiles = new File(".").listFiles(fileNameFilter);

            dbf.setAttribute(JAXP_SCHEMA_SOURCE, schemaFiles);

            log.debug("{} schema files found", schemaFiles.length);
            for (File file : schemaFiles) {
                log.debug("schema file: {}", file.getAbsolutePath());
            }

        }

        try {
            return dbf.newDocumentBuilder();
        } catch (ParserConfigurationException e) {
            throw new RuntimeException("get DocumentBuilder", e);
        }
    }
}

(我也尝试过使用文件名)。Eclipse 接受 XSD - 当放入目录时,它可以验证这里处理的 XML

肉眼看来,解析器在尝试验证时会短暂停止。这可能是网络查找。

-Djaxp.debug=1只添加这些行

JAXP: find factoryId =javax.xml.parsers.DocumentBuilderFactory
JAXP: loaded from fallback value: com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderFactoryImpl
JAXP: created new instance of class com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderFactoryImpl using ClassLoader: null

如何让 JDK 6 中的解析器告诉我它在做什么?如果我不能这样做,我如何检查其中的 XML 目录使用情况以查看为什么未选择提供的 XSD?

我忽略了什么明显的事情?

4

1 回答 1

0

你说

我们希望避免在 XML 文件中明确提及文件名

那么解析器如何能够选择合适的模式呢?

您可以尝试的是Schema,使用SchemaFactory基于所有可用模式资源的 ,创建一个 ,并将其附加到文档构建器工厂。然后解析器将根据这个“超级模式”自动验证文档。

如果您的模式集具有内部依赖关系(即导入或包含),请确保使用相对 URL 或专门的解析器正确解析这些引用。

更新:

读完这个http://java.sun.com/j2ee/1.4/docs/tutorial/doc/JAXPDOM8.html,仔细一点,我意识到你的方法应该和我的建议有同样的效果,所以还有别的正在 n. 我只能说我描述的效果很好。

于 2011-10-03T10:33:17.947 回答