3

我想通过指定的节点名称将一个 xml 文档拆分为多个 xml 文档,(类似于 string.Split(...)。)

示例:我有以下 xml 文档。

<root>
    <nodeA>
        Hello
    </nodeA>
    <nodeA>
        <nodeB>
            node b Text
        </nodeB>
        <nodeImage>
            image.jpg
        </nodeImage>
    </nodeA>
    <nodeA>
        node a text
    </nodeA>
</root>

我想通过'nodeImage'将这个xml文档分成3部分,并保留原始的xml结构。(注意:名称为“nodeImage”的节点可以在任何地方)
1. nodeImage 之前
的 xml 2. nodeImage 的 xml
3. nodeImage 之后 的 xml

对于示例 xml,结果应为:

XML 文档 1:

<root>
    <nodeA>
        Hello
    </nodeA>
    <nodeA>
        <nodeB>
            node b Text
        </nodeB>
    </nodeA>
</root>

XML 文档 2:

<root>
    <nodeA>
        <nodeImage>
            image.jpg
        </nodeImage>
    </nodeA>
</root>

XML 文档 3:

<root>
    <nodeA>
        node a text
    </nodeA>
</root>

有谁知道这个要求是否有一个好的算法或现有的代码示例?

更新说明:
如果 xml 文档中只有一个名为“nodeImage”的节点,则该 xml 文档应始终拆分为 3 个 xml 文档。

4

5 回答 5

1

“分裂”一词有点令人困惑。一次出现的拆分通常不会产生三个部分。

我首先尝试在 Linq to xml 术语中定义您的问题。对于您要创建的每次出现的 XDocument.Descendants("nodeImage") :

  • nodeImage 父级删除了 nodeImage 和所有后续节点的文档副本。此外,所有祖先都必须删除所有下一个节点。
  • 文档的副本,其中 nodeImage 元素的所有祖先都删除了所有 XElement.NextNodes 和 XElement.PreviousNodes。
  • 在 XDocument 的副本上再次运行此检查,其中所有 Ancestor PreviousNodes 已被删除。
  • 如果没有发现出现。被检查的文档被完整返回。

XDocument 的深层副本很容易。它有一个复制构造函数。当然,如果您的 xml 很大,这将占用内存。

但是,挑战在于在每个副本中找到您的节点。 这个问题展示了如何获取元素的 XPath。你可以用那个。

于 2013-08-13T11:46:28.347 回答
1
XElement xe = XElement.Load(XMLFile);

foreach(XElement newXE in xe.Elements("nodeA"))
{
    XElement root = new XElement("root",newXE);
    root.Save(newFile);
}
于 2013-08-13T09:29:04.310 回答
0

尝试这个:

using System;
using System.Xml;

class Program
{
    static void Main(string[] args)
    {
        // create the XML documents
        XmlDocument
            doc1 = new XmlDocument(),
            doc2 = new XmlDocument(),
            doc3 = new XmlDocument();

        // load the initial XMl into doc1
        doc1.Load("input.xml");

        // create the structure of doc2 and doc3
        doc2.AppendChild(doc2.ImportNode(doc1.FirstChild, false));
        doc3.AppendChild(doc3.ImportNode(doc1.FirstChild, false));
        doc2.AppendChild(doc2.ImportNode(doc1.DocumentElement, false));
        doc3.AppendChild(doc3.ImportNode(doc1.DocumentElement, false));

        // select the nodeImage
        var nodeImage = doc1.SelectSingleNode("//nodeImage");
        if (nodeImage != null)
        {
            // append to doc3
            var node3 = nodeImage.ParentNode.NextSibling;
            var n3 = doc3.ImportNode(node3, true);
            doc3.DocumentElement.AppendChild(n3);

            // append to doc2
            var n2 = doc2.ImportNode(nodeImage.ParentNode, true);
            n2.RemoveChild(n2.SelectSingleNode("//nodeImage").PreviousSibling);
            doc2.DocumentElement.AppendChild(n2);

            // remove from doc1
            nodeImage.ParentNode.ParentNode
                .RemoveChild(nodeImage.ParentNode.NextSibling);
            nodeImage.ParentNode
                .RemoveChild(nodeImage);
        }

        Console.WriteLine(doc1.InnerXml);
        Console.WriteLine(doc2.InnerXml);
        Console.WriteLine(doc3.InnerXml);
    }
}
于 2013-08-13T10:55:10.063 回答
0

像这样,使用System.Xml.Linq吗?

var doc = XDocument.Parse(stringxml);
var res = new List<XElement>();
var cur = new XElement("root");
foreach (var node in doc.Element("root").Elements("nodeA"))
{
    if (node.Element("nodeImage") == null)
    {
        cur.Add(node);
    }
    else
    {
        res.Add(cur);
        res.Add(new XElement("root", node));
        cur = new XElement("root");
    }
}
res.Add(cur);
于 2013-08-13T10:24:06.487 回答
0

这行得通。对其进行广泛测试。

var doc = new XmlDocument();
doc.LoadXml(@"<root>
<nodeA>
    Hello
</nodeA>
<nodeA>
    <nodeB>
        node b Text
    </nodeB>
    <nodeImage>
        image.jpg
    </nodeImage>
</nodeA>
<nodeA>
    node a text
</nodeA></root>");

var xmlFrags = new List<string>();
string xml = "<root>";
bool bNewFragment = true;
foreach (XmlNode nodeA in doc.SelectNodes("//root/nodeA")) {
    XmlNode nodeImage = nodeA.SelectSingleNode("nodeImage");
    if (nodeImage != null) {
        xml += "<nodeA>";
        var en = nodeA.GetEnumerator();
        while (en.MoveNext()) {
            XmlNode xn = (XmlNode)en.Current;
            if (xn != nodeImage)
            xml += xn.OuterXml;
        }
        xml += "</nodeA></root>";
        xmlFrags.Add(xml);
        xml = "<root><nodeA>" + nodeImage.OuterXml + "</nodeA></root>";
        xmlFrags.Add(xml);
        bNewFragment = true;
    }
    else 
    {
        if (bNewFragment) {
            xml = "<root>";
            bNewFragment = false;
        }
        xml += nodeA.OuterXml;
    }
}
if (!bNewFragment) {
    xml += "</root>";
    xmlFrags.Add(xml);
}
//Use the XML fragments as you like
foreach (var xmlFrag in xmlFrags)
    Console.WriteLine(xmlFrag + Environment.NewLine);
于 2013-08-13T10:25:24.640 回答