1

我有一堆凌乱的 JSON 数据要导入到我的数据库中(用于进一步的目的)。当我检查它们(在文本编辑器中打开)时,它们包含许多奇怪的(乱码)字符,例如:

  • \u00a0

例如data.json

[{"title":"hello world!","html_body":"<p>Hello\u00a0 from the\u00a0  other side.\u00a0 <\/p>"}]

然后,显然,下面的代码根本行不通:

$clean = str_replace("\u00a0", "", $string);

不管这些角色是为了什么,我怎么能摆脱它们呢?

4

2 回答 2

7

感谢评论部分的每个人,他们(至少)帮助我知道那些是non-breaking characters. 然后我用谷歌搜索并自己找到了一个可行的解决方案:

$clean_html_body = preg_replace('/\xc2\xa0/', '', $html_body);

再次感谢大家。:)

于 2017-08-24T08:06:31.767 回答
1

如果您有单独的字符串,它们的末尾可能有不间断的空格或换行符,则可以在将 JSON 数据放在一起时使用以下方法修剪它们:

$dat = 修剪($dat,"\t\n\r\0\x0B\xc2\xa0");

于 2020-02-04T16:18:10.380 回答