我正在从数据库中获取一些数据,它具有 HTML 编码字符 (
)。有哪些选项可以删除这些?
我根本不希望这些呈现...我希望将它们从数据中剥离。
目前我并不担心 HTML 标签……只是编码字符。
编辑:如果相关,这些字符会导致 JSON 验证出现一些错误。
我正在从数据库中获取一些数据,它具有 HTML 编码字符 (
)。有哪些选项可以删除这些?
我根本不希望这些呈现...我希望将它们从数据中剥离。
目前我并不担心 HTML 标签……只是编码字符。
编辑:如果相关,这些字符会导致 JSON 验证出现一些错误。
如果您想摆脱它们,请获取此类字符的列表或匹配它们的正则表达式(类似于&[a-z]+;
)并进行搜索和替换。
但是,如果您只希望它们因 JSON 验证错误而消失,则应正确生成/编码您的 JSON 以避免错误。(但是,我真的不明白它们如何导致无效的 JSON。)
在这里,简单地通过正则表达式进行修剪不应该是一种选择。例如
也可以编码 
,但&\#[0-9]+;
正则表达式会导致数据丢失,因为几乎每个字符都可以在某些时候像这样编码(例如:)<p>HELLO</p>
。