我正在尝试使用带有以下代码的 API 获取维基百科的内容(保加利亚语):
$content = file_get_contents("http://bg.wikipedia.org/w/api.php?format=json&action=query&titles=%D0%A1%D0%BE%D1%84%D0%B8%D1%8F&prop=revisions&rvprop=content");
问题是结果如下所示:
........."*":"{{\u043a\u044a\u043c \u043f\u043e\u044f\u0441\u043d\u0435\u043d\u0438\u0435|\u0421\u043e\u0444\u0438\u044f|\u0421\u043e\u0444\u0438\u044f (\u043f\u043e\u044f\u0441\u043d\u0435\u043d\u0438\u0435)}}\n{{\u0421\u0435\u043b\u0438\u0449\u0435 \u0432 \u0411\u044a\u043b\u0433\u0430\u0440\u0438\u044f\n|
即使我在浏览器中打开链接,我也会得到这个结果。如果我将 JSON 更改为 XML,效果很好,但如果格式为 JSON,则内容“不可读”。
我怎样才能获得可读的文本?或者有没有其他简单的解决方案来解析带有维基百科内容的段落?