0

我有一个用于处理的 Xml 节点。以下是我的 xml 节点。

<w:p>
 <w:r>
   <w:t>
     Text1
   </w:t>
  </w:r>
  <w:r>
    <w:pict>
       <w:p>
         <w:r>
           <w:t>
             text2
            </w:t>
          </w:r>
        </w:p>
      </w:pict>
   </w:r>
 <w:r>
   <w:t>
     Text3
   </w:t>
  </w:r>
  <w:r>
</w:p>

现在我想<w:p><w:r><w:t>只从而不是从<w:p><w:r><w:pict><w:p><w:r><w:t>.

所以,我需要的输出是Text1Text3

我的 C# 代码是:

 XmlNodeList pNode = xDoc.GetElementsByTagName("w:p");
 for (int i = 0; i < pNode.Count; i++)
 {
    if(i==0)  //This is my criteria 
    {
      XmlNode firstNode = pNode[i];
      string innerText=firstNode.innerText.toString().Trim();
    }
 }

但它返回所有内部文本,如Text1Text2Text3

请指导我摆脱这个问题?

4

3 回答 3

1

您可以使用 XPath:(我认为以下内容应该适合您)

w:p/w:r/w:t
于 2012-09-27T06:38:18.427 回答
0

您需要检查每个元素p,确保其锚点都不是pict元素。

var result = XElement.Load(@"path-to-your-xml")
                     .Descendants("t")
                     .Where(e => !e.AnchestorsAndSelf().Any(a => a.Name.LocalName == "pict"));
于 2012-09-27T06:44:39.033 回答
0

我建议您使用XDocument(如果您有 .NET 3.5 或更高版本)。此代码获取具有模式p/r/t但没有的所有元素的值pict/p/r/t

        // Use this if you're loading XML from a string
        XDocument doc = XDocument.Parse(inputString);
        // Use this if you're loading XML from a file
        //XDocument doc = XDocument.Load(<filepath>);

        var pElements = doc.Root
            .Descendants()
            .Where(el => el.Name.LocalName == "p" && el.Parent.Name.LocalName != "pict");

        List<string> innerTexts = new List<string>();
        foreach(XElement p in pElements)
        {
            var rElements =  p.Elements().Where(el => el.Name.LocalName == "r");
            foreach(XElement r in rElements)
            {
                var tElements = r.Elements().Where(el => el.Name.LocalName == "t");
                innerTexts.AddRange(tElements.Select(el => el.Value).ToArray());
            }
        }

我使用LocalName了,因为没有提供有关w命名空间的信息。

于 2012-09-27T07:16:53.843 回答