1

我有一个使用 utf-8 编码创建的 XML 文档。我想将该文档存储在 sql 2008 xml 列中,但我知道我需要将其转换为 utf-16 才能做到这一点。

我尝试使用 XDocument 来执行此操作,但在转换后我没有得到有效的 XML 结果。这是我尝试进行的转换(Utf8StringWriter 是一个从 StringWriter 继承并重载编码的小类):

XDocument xDoc = XDocument.Parse(utf8Xml);
StringWriter writer = new StringWriter();
XmlWriter xml = XmlWriter.Create(writer, new XmlWriterSettings() 
                { Encoding = writer.Encoding, Indent = true });

xDoc.WriteTo(xml);

string utf16Xml = writer.ToString();

utf16Xml 中的数据无效,尝试插入数据库时​​出现错误:

{"XML parsing: line 1, character 38, unable to switch the encoding"}

然而,最初的 utf8Xml 数据绝对是有效的,并且包含了我需要的所有信息。

更新:初始 XML 是通过使用 XMLSerializer(带有 Utf8StringWriter 类)从现有对象模型(引擎)创建 xml 字符串来获得的。代码是:

public static void Serialise<T>(T engine, ref StringWriter writer)
{
    XmlWriter xml = XmlWriter.Create(writer, new XmlWriterSettings() { Encoding = writer.Encoding });

    XmlSerializer xs = new XmlSerializer(engine.GetType());

    xs.Serialize(xml, engine);
}

我必须像这样离开,因为我无法控制更改该代码。

在我什至将 utf16Xml 字符串发送到失败的数据库调用之前,我可以通过 Visual Studio 调试器查看它,我注意到整个字符串不存在,而是在 XML 查看器上收到字符串文字未关闭错误。

4

3 回答 3

2

从 utf8xml 解析文档后,将文档的编码设置为 UTF-16

XDocument xDoc = XDocument.Parse(utf8Xml);
xDoc.Declaration.Encoding = "utf-16";
StringWriter writer = new StringWriter();
XmlWriter xml = XmlWriter.Create(writer, new XmlWriterSettings() 
                { Encoding = writer.Encoding, Indent = true });

xDoc.WriteTo(xml);

string utf16Xml = writer.ToString();
于 2012-06-05T01:30:04.860 回答
2

错误在第一行XDocument xDoc = XDocument.Parse(utf8Xml);。很可能您将 utf8 流转换为字符串 (utf8xml),但字符串中指定的编码仍然是 utf-8,因此 XML 阅读器失败。如果为真,则使用Load直接从流中加载 XML,而不是先将其转换为字符串。

于 2012-06-05T01:52:54.283 回答
0

这是我必须做的才能让它工作。这只是将 XML 转换为 utf-16

string getUtf16Xml(System.Xml.XmlDocument xmlDoc)
{    
   System.Xml.Linq.XDocument xDoc = System.Xml.Linq.XDocument.Parse(xmlDoc.OuterXml);
   xDoc.Declaration.Encoding = "utf-16";

   return xDoc.ToString();    
}

然后我可以将结果保存到数据库中。

于 2018-10-31T23:08:36.643 回答