0

我使用 jena 从 dbpedia 获得了一些数据,并且由于 jena 的输出基于 xml,因此在某些情况下需要对 xml 字符进行不同的处理,如下所示:

Guns n ' Roses

我只是想知道这是什么类型的econding?我想在javascript的帮助下根据上面的encode(r)对我的输入进行解码/编码并将其发送回servlet。

(编辑后的帖子,如果您删除 & 和 amp 之间的空格,您将获得正确的字符,因为在 stackoverflow 中我找不到这样做的方法,我决定这样做!)

4

2 回答 2

2

似乎是 XML 实体编码,以及数字字符引用(十进制)。

数字字符引用通过其通用字符集/ Unicode代码点引用字符,并使用格式

您可以在此处获取一些信息:Wikipedia 上的 XML 和 HTML 字符实体引用列表

你的字符是数字 39,是撇号:',也可以用字符实体引用:来引用'

要使用 Javascript 对此进行解码,您可以使用 example php.js,它具有一个html_entity_decode()函数(请注意,它取决于get_html_translation_table())。


更新:回复您的编辑:基本上是一样的,唯一的区别是它被编码了两次(可能是错误的)。&是和号:&.

于 2012-05-05T20:29:34.140 回答
1

这是一个 SGML/HTML/XML 数字字符实体参考

在这种情况下为撇号'

于 2012-05-05T20:29:27.743 回答