0

我收到了大量的 Xml,我需要从中提取部分文本元素并将其重新用于其他目的。(我正在使用 XDocument 来提取 Xml 数据)。

但是,如何解码元素中包含的文本?这里使用的格式是什么?几个例子:

"What is the meaning of this® asks Sonny."
"The big centre cost 1¾ million pounds"
"... lost it. ® The next ..."

我试过HttpUtility.HtmlDecode了,但这并没有成功。如果我解码两次“®” 变成一个显然不正确的®。

看起来像 ® 是换行符。® 可能是问号。190的,我也不知道。也许是一个点或逗号?

任何想法都会受到欢迎。

4

1 回答 1

0

您显示的字符串似乎已经过 HTML 编码,然后是 XML 编码(或再次编码为 HTML)。

正确的是- ®> ®-> ®(注册商标符号)每个ISO Latin-1 实体-®应该以相同的方式表现

同样&amp#190;会变成代表四分之三的分数。

于 2012-04-06T10:20:39.297 回答