1

我正在从数据库中获取一些数据,它具有 HTML 编码字符 (  )。有哪些选项可以删除这些?

我根本不希望这些呈现...我希望将它们从数据中剥离。

目前我并不担心 HTML 标签……只是编码字符。

编辑:如果相关,这些字符会导致 JSON 验证出现一些错误。

4

2 回答 2

1

如果您想摆脱它们,请获取此类字符的列表或匹配它们的正则表达式(类似于&[a-z]+;)并进行搜索和替换。

但是,如果您只希望它们因 JSON 验证错误而消失,则应正确生成/编码您的 JSON 以避免错误。(但是,我真的不明白它们如何导致无效的 JSON。)

于 2013-01-01T22:12:37.733 回答
0

在这里,简单地通过正则表达式进行修剪不应该是一种选择。例如&nbsp;也可以编码&#160;,但&\#[0-9]+;正则表达式会导致数据丢失,因为几乎每个字符都可以在某些时候像这样编码(例如:)<p>&#72;&#69;&#76;&#76;&#79;</p>

于 2013-01-01T22:35:10.450 回答