2

我有一个文本流,其中包含任意纯文本和格式良好的 xml 元素的片段。如何阅读它并仅提取 xml 元素?ConformanceLevel 设置为 Fragment 的 XmlReader 在遇到纯文本时仍会引发异常,这对它来说是格式错误的 xml。

有任何想法吗?谢谢

到目前为止,这是我的代码:

XmlReaderSettings settings = new XmlReaderSettings();
settings.ConformanceLevel = ConformanceLevel.Fragment;

using (XmlReader reader = XmlReader.Create(stream, settings))
    while (!reader.EOF)
    {
        reader.MoveToContent();
        XmlDocument doc = new XmlDocument();
        doc.Load(reader.ReadSubtree());
        reader.ReadEndElement();
    }

这是一个示例流内容,顺便说一下,我无法控制它:

Found two objects:
Object a
<object>
    <name>a</name>
    <description></description>
</object>
Object b
<object>
    <name>b</name>
    <description></description>
</object>
4

1 回答 1

1

假设这是一个 hack,如果你用“假”xml 根节点包装你的混合文档,你应该能够做你需要的事情,只在子节点中获取元素类型的节点(即跳过文本节点)根元素:

using System;
using System.Linq;
using System.Xml;

static class Program {

    static void Main(string[] args) {

        string mixed = @"
Found two objects:
Object a
<object>
    <name>a</name>
    <description></description>
</object>
Object b
<object>
    <name>b</name>
    <description></description>
</object>
";
        string xml = "<FOO>" + mixed + "</FOO>";
        XmlDocument doc = new XmlDocument();
        doc.LoadXml(xml);
        var xmlFragments = from XmlNode node in doc.FirstChild.ChildNodes 
                           where node.NodeType == XmlNodeType.Element 
                           select node;
        foreach (var fragment in xmlFragments) {
            Console.WriteLine(fragment.OuterXml);
        }

    }

}
于 2012-07-19T08:23:52.800 回答