74

关于为什么- 至少在 .Net 框架中 - 在执行 XPath 查询时有XmlNamespaceManager必要[local-name()=...使用. 我确实理解为什么命名空间是必要的或至少是有益的,但为什么它如此复杂?

为了查询一个简单的 XML 文档(无命名空间)...

<?xml version="1.0" encoding="ISO-8859-1"?>
<rootNode>
   <nodeName>Some Text Here</nodeName>
</rootNode>

...一个人可以使用类似的东西doc.SelectSingleNode("//nodeName")(匹配<nodeName>Some Text Here</nodeName>

谜团#1我的第一个烦恼——如果我理解正确的话——仅仅是将命名空间引用添加到父/根标记(无论是否用作子节点标记的一部分),如下所示:

<?xml version="1.0" encoding="ISO-8859-1"?>
<rootNode xmlns="http://example.com/xmlns/foo">
   <nodeName>Some Text Here</nodeName>
</rootNode>

...需要几行额外的代码才能获得相同的结果:

Dim nsmgr As New XmlNamespaceManager(doc.NameTable)
nsmgr.AddNamespace("ab", "http://example.com/xmlns/foo")
Dim desiredNode As XmlNode = doc.SelectSingleNode("//ab:nodeName", nsmgr)

...基本上梦想着一个不存在的前缀(“ ab”)来找到一个甚至不使用前缀的节点。这有什么意义?(概念上)有什么问题doc.SelectSingleNode("//nodeName")

谜团 #2:假设您有一个使用前缀的 XML 文档:

<?xml version="1.0" encoding="ISO-8859-1"?>
<rootNode xmlns:cde="http://example.com/xmlns/foo" xmlns:feg="http://example.com/xmlns/bar">
   <cde:nodeName>Some Text Here</cde:nodeName>
   <feg:nodeName>Some Other Value</feg:nodeName>
   <feg:otherName>Yet Another Value</feg:otherName>
</rootNode>

...如果我理解正确,您必须将两个命名空间都添加到XmlNamespaceManager, 以便查询单个节点...

Dim nsmgr As New XmlNamespaceManager(doc.NameTable)
nsmgr.AddNamespace("cde", "http://example.com/xmlns/foo")
nsmgr.AddNamespace("feg", "http://example.com/xmlns/bar")
Dim desiredNode As XmlNode = doc.SelectSingleNode("//feg:nodeName", nsmgr)

...为什么,在这种情况下,我需要(概念上)一个命名空间管理器?

******已编辑为以下评论****

编辑添加: 我修改和完善的问题是基于 XmlNamespaceManager 在我认为大多数情况下的明显冗余以及使用命名空间管理器来指定前缀到 URI 的映射:

当名称空间前缀(“cde”)到名称空间 URI(“ http://example.com/xmlns/foo ”)的直接映射在源文档中明确说明时:

...<rootNode xmlns:cde="http://example.com/xmlns/foo"...

程序员在进行查询之前重新创建该映射的概念需求是什么?

4

6 回答 6

21

基本点(正如上面Kev所指出的),是命名空间URI是命名空间的重要部分,而不是命名空间前缀,前缀是“任意方便”

至于为什么需要命名空间管理器,而不是使用文档来解决问题,我可以想到两个原因。

原因一

如果只允许向 documentElement 添加命名空间声明,就像在您的示例中那样,那么 selectSingleNode 只使用定义的任何内容确实是微不足道的。

但是,您可以在文档中的任何元素上定义名称空间前缀,并且名称空间前缀不会唯一绑定到文档中的任何给定名称空间。考虑以下示例

<w xmlns:a="mynamespace">
  <a:x>
    <y xmlns:a="myOthernamespace">
      <z xmlns="mynamespace">
      <b:z xmlns:b="mynamespace">
      <z xmlns="myOthernamespace">
      <b:z xmlns:b="myOthernamespace">
    </y>
  </a:x>
</w>

在这个例子中,你想要什么//z//a:z//b:z返回?如果没有某种外部命名空间管理器,你会如何表达?

原因 2

它允许您对任何等效文档重用相同的 XPath 表达式,而无需了解正在使用的名称空间前缀的任何信息。

myXPathExpression = "//z:y"
doc1.selectSingleNode(myXPathExpression);
doc2.selectSingleNode(myXPathExpression);

文档1:

<x>
  <z:y xmlns:z="mynamespace" />
</x>

文档2:

<x xmlns"mynamespace">
  <y>
</x>

为了在没有命名空间管理器的情况下实现后一个目标,您必须检查每个文档,为每个文档构建一个自定义 XPath 表达式。

于 2011-10-27T19:58:36.507 回答
14

原因很简单。您在 XPath 查询中使用的前缀与 xml 文档中声明的前缀之间没有必要的连接。举个例子,下面的 xmls 在语义上是等价的:

<aaa:root xmlns:aaa="http://someplace.org">
 <aaa:element>text</aaa:element>
</aaa:root>

对比

  <bbb:root xmlns:bbb="http://someplace.org">
     <bbb:element>text</bbb:element>
  </bbb:root>

ccc:root/ccc:element” 查询将匹配这两个实例,前提是命名空间管理器中有一个映射。

nsmgr.AddNamespace("ccc", "http://someplace.org")

.NET 实现不关心 xml 中使用的文字前缀,只关心为查询文字定义的前缀并且命名空间值与文档的实际值匹配。即使使用的文档之间的前缀不同,这也需要具有常量查询表达式,并且它是一般情况下的正确实现。

于 2011-10-05T14:23:54.720 回答
13

据我所知,如果您有这样的文档,则没有充分的理由需要手动定义XmlNamespaceManager以获取abc-prefixed 节点:

<itemContainer xmlns:abc="http://abc.com" xmlns:def="http://def.com">
    <abc:nodeA>...</abc:nodeA>
    <def:nodeB>...</def:nodeB>
    <abc:nodeC>...</abc:nodeC>
</itemContainer>

微软根本懒得写一些东西来检测xmlns:abc已经在父节点中指定的东西。我可能是错的,如果是这样,我欢迎对此答案发表评论,以便我更新它。

然而,这篇博文似乎证实了我的怀疑。它基本上说您需要手动定义一个XmlNamespaceManager并手动迭代xmlns:属性,将每个属性添加到名称空间管理器中。不知道为什么微软不能自动做到这一点。

这是我基于该博客文章创建的一种方法,用于XmlNamespaceManager根据xmlns:源的属性自动生成一个XmlDocument

/// <summary>
/// Creates an XmlNamespaceManager based on a source XmlDocument's name table, and prepopulates its namespaces with any 'xmlns:' attributes of the root node.
/// </summary>
/// <param name="sourceDocument">The source XML document to create the XmlNamespaceManager for.</param>
/// <returns>The created XmlNamespaceManager.</returns>
private XmlNamespaceManager createNsMgrForDocument(XmlDocument sourceDocument)
{
    XmlNamespaceManager nsMgr = new XmlNamespaceManager(sourceDocument.NameTable);

    foreach (XmlAttribute attr in sourceDocument.SelectSingleNode("/*").Attributes)
    {
        if (attr.Prefix == "xmlns")
        {
            nsMgr.AddNamespace(attr.LocalName, attr.Value);
        }
    }

    return nsMgr;
}

我像这样使用它:

XPathNavigator xNav = xmlDoc.CreateNavigator();
XPathNodeIterator xIter = xNav.Select("//abc:NodeC", createNsMgrForDocument(xmlDoc));
于 2011-10-05T13:34:06.817 回答
4

我回答第1点:

为 XML 文档设置默认命名空间仍然意味着节点,即使没有命名空间前缀,即:

<rootNode xmlns="http://someplace.org">
   <nodeName>Some Text Here</nodeName>
</rootNode>

不再在“空”命名空间中。您仍然需要一些方法来使用 XPath 引用这些节点,因此您创建一个前缀来引用它们,即使它是“编造的”。

回答第 2 点:

<rootNode xmlns:cde="http://someplace.org" xmlns:feg="http://otherplace.net">
   <cde:nodeName>Some Text Here</cde:nodeName>
   <feg:nodeName>Some Other Value</feg:nodeName>
   <feg:otherName>Yet Another Value</feg:otherName>
</rootNode>

在实例文档的内部,位于命名空间中的节点与它们的节点名称和它们的长命名空间名称一起存储,它被称为(在 W3C 术语中)扩展名称

例如<cde:nodeName>本质上存储为<http://someplace.org:nodeName>. 命名空间前缀对人类来说是一种任意便利,因此当我们输入 XML 或必须读取它时,我们不必这样做:

<rootNode>
   <http://someplace.org:nodeName>Some Text Here</http://someplace.org:nodeName>
   <http://otherplace.net:nodeName>Some Other Value</http://otherplace.net:nodeName>
   <http://otherplace.net:otherName>Yet Another Value</http://otherplace.net:otherName>
</rootNode>

搜索 XML 文档时,不是通过友好前缀搜索,而是通过命名空间 URI 进行搜索,因此您必须通过 using 传入的命名空间表告诉 XPath 您的命名空间XmlNamespaceManager

于 2011-08-24T15:38:43.470 回答
3

您需要将 URI/前缀对注册到 XmlNamespaceManager 实例,以让 SelectSingleNode() 知道您指的是哪个特定的“nodeName”节点 - 来自“http://someplace.org”的节点或来自“http: //otherplace.net”。

请注意,在执行 XPath 查询时,具体的前缀名称并不重要。我相信这也有效:

Dim nsmgr As New XmlNamespaceManager(doc.NameTable)
nsmgr.AddNamespace("any", "http://someplace.org")
nsmgr.AddNamespace("thing", "http://otherplace.net")
Dim desiredNode As XmlNode = doc.SelectSingleNode("//thing:nodeName", nsmgr)

SelectSingleNode() 只需要XPath 表达式的前缀和命名空间URI 之间的连接。

于 2011-08-26T13:15:18.587 回答
3

这个线程帮助我更清楚地理解了命名空间的问题。谢谢。当我看到Jez 的代码时,我尝试了它,因为它看起来比我编程的更好。不过,我发现了它的一些缺点。正如所写,它只在根节点中查找(但名称空间可以在任何地方列出。),并且它不处理默认名称空间。我试图通过修改他的代码来解决这些问题,但无济于事。

这是我对该功能的版本。它使用正则表达式来查找整个文件的命名空间映射;使用默认命名空间,给它们任意前缀“ns”;并处理同一命名空间的多次出现。

private XmlNamespaceManager CreateNamespaceManagerForDocument(XmlDocument document)
{
    var nsMgr = new XmlNamespaceManager(document.NameTable);

    // Find and remember each xmlns attribute, assigning the 'ns' prefix to default namespaces.
    var nameSpaces = new Dictionary<string, string>();
    foreach (Match match in new Regex(@"xmlns:?(.*?)=([\x22\x27])(.+?)\2").Matches(document.OuterXml))
        nameSpaces[match.Groups[1].Value + ":" + match.Groups[3].Value] = match.Groups[1].Value == "" ? "ns" : match.Groups[1].Value;

    // Go through the dictionary, and number non-unique prefixes before adding them to the namespace manager.
    var prefixCounts = new Dictionary<string, int>();
    foreach (var namespaceItem in nameSpaces)
    {
        var prefix = namespaceItem.Value;
        var namespaceURI = namespaceItem.Key.Split(':')[1];
        if (prefixCounts.ContainsKey(prefix)) 
            prefixCounts[prefix]++; 
        else 
            prefixCounts[prefix] = 0;
        nsMgr.AddNamespace(prefix + prefixCounts[prefix].ToString("#;;"), namespaceURI);
    }
    return nsMgr;
}
于 2013-12-04T00:06:44.667 回答