我需要你的帮助。
我有一个大型 UTF-8 JSON 文档,其中一些字符串属性来自 ISO-8859-1 源。
结果产生了这个例子:
{
"id":"3",
"name_fr":"Algérie",
"name_en":"Algeria"
};
...
{
"id":"7",
"label":"Horizon 2020",
"link":"http://www.rennes-metropole.fr/developpement-durable/horizon-2020/horizon-2020-l-exposition.html",
"comment":"<P ALIGN=\"LEFT\">Lââ¬â¢exposition ë Horizon 2020 û est une promenade dans le Pays de Rennes. Dans cette promenade, vous rencontrez huit étapes qui concernent les principales questions à l'horizon 2020.</P>",
"illustration_file_id":"0"
},
考虑到这一点,有什么简单的方法可以修复我的文档:
- 该文档将近 500 KB 大
- 我不能只是查找/替换,因为它还包含错误编码的字符,例如“«”变成“ë”
?
我正在尝试在 php 或 javascript 中执行此操作,但我对任何解决方案持开放态度。
非常感谢 !