3

我将 XML 存储在 SQL Server 的 XML 列中。SQL Server 在内部以 UTF-16 存储数据。因此,存储的 XML 必须采用 UTF-16 格式。

我拥有的 XML 是 utf-8,它的顶部有这个声明:

<?xml version="1.0" encoding="UTF-8" ?>

当我尝试使用 UTF-8 声明插入 xml 时,我收到一个异常,说明有关编码的内容。我可以通过两种方式轻松解决此问题:

  • 通过删除声明或

  • 通过将声明更改为

<?xml version="1.0" encoding="UTF-16" ?>

问题

我不知道仅删除或替换声明是否“安全”或正确。我会丢失数据,还是 XML 会损坏?还是我必须将 C# 中的字符串从 utf-8 转换为 utf-16?

4

2 回答 2

3

C# 将字符串存储在 UCS-2 中,这是 UTF-16 标准的旧版本。因此,当您在 C# 中读取 UTF-8 字符串时,C# 会将其转换为 UCS-2。它是您传输到 SQL Server 的 UCS-2 变体。

您可以将 xml 声明更改为encoding="UTF-16"或完全省略它。UCS-2 和 UTF-16 有一些区别;我很想知道这会如何影响 C# 和 SQL Server!

于 2012-06-08T10:31:20.233 回答
0

SQL Server 在内部使用 UCS-2 来存储 XML 数据,但这与将数据传递给 SQL Server 的形式无关。

例如,如果您使用varchar文字插入它,请将其nvarchar改为文字并将编码声明为 UTF-16。样本:

DECLARE @VAR XML
INSERT INTO MyTable (MyXmlColumn) 
    VALUES (N'<?xml version="1.0" encoding="UTF-16" ?><doc></doc>')
于 2012-06-08T10:26:31.600 回答