11

我想测试(真或假)任意 XML 文件是否与给定模式匹配。

值得一提的是,该架构是 Word 2003 WordML 架构,Microsoft 使用大约 7 个*.xsd文件的列表来定义它。

这些文件之一还包括 W3Cxml.xsd文件,包括以下语句:

<xsd:import id="xml" namespace="http://www.w3.org/XML/1998/namespace"
    schemaLocation="http://www.w3.org/2001/xml.xsd"></xsd:import>

我正在使用如下所示的 .NET 代码进行验证:

   public static void validate(string filename)
    {
       XmlReaderSettings settings = new XmlReaderSettings();
       settings.Schemas.Add(
           "http://schemas.microsoft.com/office/word/2003/wordml",
           //to get this file I downloaded "Office 2003: XML Reference Schemas", i.e. "Office2003XMLSchema.exe" 
           @"C:\Program Files\Microsoft Office 2003 Developer Resources\Microsoft Office 2003 XML Reference Schemas\WordprocessingML Schemas\wordnet.xsd"
           );
        settings.ValidationType = ValidationType.Schema;
        settings.ValidationEventHandler += new ValidationEventHandler(validationEventHandler);
        XmlReader xmlReader = XmlReader.Create(filename, settings);
        while (xmlReader.Read()) { }
   }

我的问题是,如果我在未连接到互联网的机器上运行此代码,那么我会收到一个XmlSchemaValidationException错误,大意是它 can't find xml.xsd

为了解决这个问题,我下载了 xml.xsd 的副本,并使用以下settings.Schemas.Add方法显式添加它:当机器未连接到 Internet 时,验证现在可以正常工作。

但是,当机器连接到互联网时,我现在收到一条错误消息The global attribute 'http://www.w3.org/XML/1998/namespace:lang' has already been declared.

所以显然我需要明确添加它,或者我不需要,这取决于机器是否能够从互联网上静默下载它(或者甚至可能以前能够下载它,并将它缓存在某个地方)。

所以,它是“如果我这样做该死,如果我不这样做该死”。我是否需要以一种方式尝试,捕获异常,然后以另一种方式尝试?还是有更优雅的解决方案?

4

1 回答 1

4

我们看不到您的代码,但在许多实现中,这是通过使用目录解析器将 .xsd 的请求重定向到本地副本来处理的。有一个可用于此的属性XmlReaderSettings.XmlResolver 。请参阅XMLCatalog.net,了解您可以使用的 Apache 许可实现。

这样做的一个副作用是您可以将所有模式缓存在本地。这一点尤其重要,因为 W3C 会阻止对其站点的过度读取,并且您的代码(或更糟糕的是,您的客户的代码)会随机开始失败。

于 2010-08-17T03:21:54.447 回答