c# - 从 Xml 解码字符串的问题

Question

我收到了大量的 Xml，我需要从中提取部分文本元素并将其重新用于其他目的。（我正在使用 XDocument 来提取 Xml 数据）。

但是，如何解码元素中包含的文本？这里使用的格式是什么？几个例子：

"What is the meaning of this&amp;reg; asks Sonny."
"The big centre cost 1&amp;#190; million pounds"
"... lost it. &amp;#174; The next ..."

我试过HttpUtility.HtmlDecode了，但这并没有成功。如果我解码两次“®” 变成一个显然不正确的®。

看起来像 ® 是换行符。＆reg; 可能是问号。190的，我也不知道。也许是一个点或逗号？

任何想法都会受到欢迎。

score 0 · Accepted Answer

您显示的字符串似乎已经过 HTML 编码，然后是 XML 编码（或再次编码为 HTML）。

正确的是- &reg;> ®-> ®（注册商标符号）每个ISO Latin-1 实体-&#174;应该以相同的方式表现

同样&amp#190;会变成代表四分之三的分数。

1 回答 1