3

我正在使用 .NET XmlReader 打开一个 XML 文件并将该文件保存在另一个文件名中,并且似乎 DOCTYPE 声明在两个文件之间发生了变化。虽然新保存的文件仍然是有效的 XML,但我想知道为什么它坚持要更改原始标签。

Dim oXmlSettings As Xml.XmlReaderSettings = New Xml.XmlReaderSettings()
oXmlSettings.XmlResolver = Nothing
oXmlSettings.CheckCharacters = False
oXmlSettings.ProhibitDtd = False
oXmlSettings.IgnoreWhitespace = True

Dim oXmlDoc As XmlReader = XmlReader.Create(pathToOriginalXml, oXmlSettings)
Dim oDoc As XmlDocument = New XmlDocument()
oDoc.Load(oXmlDoc)
oDoc.Save(pathToNewXml)

以下(在原始文件中):

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd">

变为(注意末尾的 [ ] 字符):

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML Basic 1.1//EN" "http://www.w3.org/TR/xhtml-basic/xhtml-basic11.dtd"[]>
4

3 回答 3

8

当您设置 XmlDocument.XmlResolver = null 时,System.Xml 中存在错误。解决方法是创建一个自定义 XmlTextWriter:

    private class NullSubsetXmlTextWriter : XmlTextWriter
    {
        public NullSubsetXmlTextWriter(String inputFileName, Encoding encoding)
            : base(inputFileName, encoding)
        {
        }
        public override void WriteDocType(string name, string pubid, string sysid, string subset)
        {
            if (subset == String.Empty)
            {
                subset = null;
            }
            base.WriteDocType(name, pubid, sysid, subset);
        }
    }

在您的代码中,创建一个新的 NullSubsetXmlTextWriter(pathToNewXml, Encoding.UTF8) 并将该对象传递给 oDoc.Save() 方法。

这是Microsoft 支持案例,您可以在其中阅读解决方法(它描述了解决方法,但不提供代码)。

于 2009-07-01T17:03:07.137 回答
1

可能该库将 DOCTYPE 元素解析为内部结构,然后将该结构转换回文本。它不存储原始字符串形式。

于 2008-11-13T02:19:28.113 回答
0

这是最适合您的解决方案:

writer.WriteDocType("Name", Nothing, 
                    "http://xml.cxml.org/schemas/cXML/1.2.033/Fulfill.dtd", Nothing) 

如果你使用Nothing你不会得到 [] 或 "" 等

于 2019-10-24T21:08:41.963 回答