15

背景:

我们正在构建一个应用程序,它允许我们的客户以预定义的(即我们不控制)XML 格式提供数据。XSD 由第三方提供给我们,我们希望在处理之前收到一个通过模式验证的 XML 文件。

问题:

我们提供的 XSD 包含默认命名空间和目标命名空间,这意味着如果客户提供的 XML 文件不包含命名空间,则验证将通过。我们显然不希望他们提供说他们通过但不应该通过的东西,但更大的担忧是如果我找不到解决方案,我们将需要对每个元素进行大量额外检查XML 验证。

问题:

是否可以强制 .NET 执行验证并忽略提供的 XML 和 XSD 上的命名空间。即以某种方式“假设”命名空间已附加。

  1. 是否可以轻松可靠地删除内存中的命名空间?
  2. 在这些情况下,最佳做法是什么?

我到目前为止的解决方案:

  1. 每次更新时从 XSD 中删除命名空间(不应该很频繁。这并不能解决这样一个事实,即如果他们提供命名空间,它仍然会通过验证。
  2. 从 XSD 中删除命名空间,并找到一种方法每次都从传入的 XML 中剥离命名空间。这似乎需要很多代码来执行一些简单的事情。
  3. 在验证 XML 文件之前对其进行一些资格预审,以确保其具有正确的命名空间。如果文件的内容正确,则由于命名空间无效而使它们失败似乎是错误的。
  4. 创建一个没有命名空间的重复 XSD,但是如果它们只是提供了错误的命名空间或不同的命名空间,那么它仍然会通过。

示例 XML:

<?xml version="1.0"?>
<xsd:schema version='3.09' elementFormDefault='qualified' attributeFormDefault='unqualified' id='blah' targetNamespace='urn:schemas-blah.com:blahExample' xmlns='urn:blah:blahExample' xmlns:xsd='http://www.w3.org/2001/XMLSchema'>
...
</xsd:schema>

具有不同的命名空间

 <?xml version="1.0" encoding="UTF-8" ?> 
<root xmlns="urn:myCompany.com:blahExample1" attr1="2001-03-03" attr2="google" >
...
</root>

根本没有命名空间。

 <?xml version="1.0" encoding="UTF-8" ?> 
<root attr1="2001-03-03" attr2="google" >
...
</root>
4

2 回答 2

6

试图解决同样的问题。我想出了一个我认为是相当干净的解决方案。为清楚起见,我省略了对输入参数的一些验证。

首先,场景:有一个接收文件的网络服务,该文件应该是“格式良好的”xml,并且对 XSD 有效。当然,我们不相信“形式良好”,也不相信“我们知道”是正确的对 XSD 有效。

这种 webservice 方法的代码如下所示,我认为它是不言自明的。

主要兴趣点是验证发生的顺序,在加载之前不检查命名空间,而是在之后检查,但要干净。

我决定我可以接受一些异常处理,因为预计大多数文件都是“好”的,因为这是处理的框架方式(所以我不会反对它)。

private DataTable xmlErrors;
[WebMethod]
public string Upload(byte[] f, string fileName) {
    string ret = "This will have the response";

    // this is the namespace that we want to use
    string xmlNs = "http://mydomain.com/ns/upload.xsd";

    // you could put a public url of xsd instead of a local file
    string xsdFileName = Server.MapPath("~") + "//" +"shiporder.xsd"; 

    // a simple table to store the eventual errors 
    // (more advanced ways possibly exist)
    xmlErrors = new DataTable("XmlErrors");
    xmlErrors.Columns.Add("Type");
    xmlErrors.Columns.Add("Message");

    try {
        XmlDocument doc = new XmlDocument(); // create a document

        // bind the document, namespace and xsd
        doc.Schemas.Add(xmlNs, xsdFileName); 

        // if we wanted to validate if the XSD has itself XML errors
        // doc.Schemas.ValidationEventHandler += 
        // new ValidationEventHandler(Schemas_ValidationEventHandler);

        // Declare the handler that will run on each error found
        ValidationEventHandler xmlValidator = 
            new ValidationEventHandler(Xml_ValidationEventHandler);

        // load the document 
        // will trhow XML.Exception if document is not "well formed"
        doc.Load(new MemoryStream(f));

        // Check if the required namespace is present
        if (doc.DocumentElement.NamespaceURI == xmlNs) {

            // Validate against xsd 
            // will call Xml_ValidationEventHandler on each error found
            doc.Validate(xmlValidator);

            if (xmlErrors.Rows.Count == 0) {
                ret = "OK";
            } else {
                // return the complete error list, this is just to proove it works
                ret = "File has " + xmlErrors.Rows.Count + " xml errors ";
                ret += "when validated against our XSD.";
            }
        } else {
            ret = "The xml document has incorrect or no namespace.";                
        }
    } catch (XmlException ex) {
        ret = "XML Exception: probably xml not well formed... ";
        ret += "Message = " + ex.Message.ToString();
    } catch (Exception ex) {
        ret = "Exception: probably not XML related... "
        ret += "Message = " + ex.Message.ToString();
    }
    return ret;
}

private void Xml_ValidationEventHandler(object sender, ValidationEventArgs e) {
    xmlErrors.Rows.Add(new object[] { e.Severity, e.Message });
}

现在,xsd 会有类似的东西:

<?xml version="1.0" encoding="utf-8"?>
<xs:schema id="shiporder"
    targetNamespace="http://mydomain.com/ns/upload.xsd"
    elementFormDefault="qualified"
    xmlns="http://mydomain.com/ns/upload.xsd"
    xmlns:mstns="http://mydomain.com/ns/upload.xsd"
    xmlns:xs="http://www.w3.org/2001/XMLSchema"
>
    <xs:simpleType name="stringtype">
      <xs:restriction base="xs:string"/>
    </xs:simpleType>
    ...
    </xs:schema>

“好”的 XML 类似于:

<?xml version="1.0" encoding="utf-8" ?>
<shiporder orderid="889923"  xmlns="http://mydomain.com/ns/upload.xsd">
  <orderperson>John Smith</orderperson>
  <shipto>
    <names>Ola Nordmann</names>
    <address>Langgt 23</address>

我测试了“XML 格式错误”、“根据 XSD 输入无效”、“命名空间不正确”。

参考:

从内存流中读取

尝试避免异常处理检查是否良好

针对 XSD 进行验证,捕获错误

关于内联模式验证的有趣帖子


马丁,评论部分对我的答案来说太短了,所以我会在这里给出,它可能是也可能不是完整的答案,让我们一起改进:)

我做了以下测试:

  • 测试:xmlns="blaa"
  • 结果:由于命名空间错误,文件被拒绝。
  • 测试: xmlns="http://mydomain.com/ns/upload.xsd" 和 xmlns:a="blaa" 元素有 "a:someElement"
  • 结果:文件返回错误说它不期望“a:someElement”
  • 测试: xmlns="http://mydomain.com/ns/upload.xsd" 和 xmlns:a="blaa" 元素有“someElement”,缺少一些必需的属性
  • 结果:文件返回错误,指出该属性丢失

遵循的策略(我更喜欢)是,如果文档不符合,则不接受,但提供一些有关原因的信息(例如“错误的命名空间”)。

这个策略似乎与你之前所说的相反:

但是,如果客户在提交的 XML 中遗漏了命名空间声明,那么我想说我们仍然可以验证它。我不想只是说“你搞砸了,现在解决它!”

在这种情况下,您似乎可以忽略 XML 中定义的命名空间。为此,您将跳过正确命名空间的验证:

    ...
    // Don't Check if the required namespace is present
    //if (doc.DocumentElement.NamespaceURI == xmlNs) {

        // Validate against xsd 
        // will call Xml_ValidationEventHandler on each error found
        doc.Validate(xmlValidator);

        if (xmlErrors.Rows.Count == 0) {
            ret = "OK - is valid against our XSD";
        } else {
            // return the complete error list, this is just to proove it works
            ret = "File has " + xmlErrors.Rows.Count + " xml errors ";
            ret += "when validated against our XSD.";
        }
    //} else {
    //    ret = "The xml document has incorrect or no namespace.";                
    //}
    ...


其他想法...

在平行的思路中,要用您自己的名称替换提供的名称空间,也许您可​​以设置doc.DocumentElement.NamespaceURI = "mySpecialNamespace"因此替换根元素的名称空间。

参考

将多个命名空间添加到根元素

于 2012-06-14T16:23:42.073 回答
0

XSD 模式背后的全部意义在于它将无类型的 XML 转换为强类型的 XML。

XML 类型可以定义为节点名和命名空间的组合。

如果有人向您发送没有命名空间的 XML,那么尽管有意,XML 并未引用 XSD 模式定义的类型。

从 XML 验证的角度来看,XML 是有效的,只要

  1. 它形成良好
  2. 它确认任何类型化的 XML 定义,由 xmlns 属性指定
于 2012-01-04T13:55:41.767 回答