1

我想获取维基百科页面的内容,然后用它做一些有趣的事情。

我的想法是我想以 XML/JSON 格式获取它们,而目前我似乎没有找到一种方法来做到这一点。

目前我成功地做到了这一点:

https://en.wikipedia.org/w/api.php?action=query&format=jsonfm&prop=revisions&titles=April_1&rvprop=content&rvcontentformat=text%2Fx-wiki

但是我收到了 XWiki 中的内容,但由于页面不支持它,我无法将其更改为 JSON。

如何将 XWiki 解析为 JSON 或如何获取页面内容。

谢谢!

4

1 回答 1

0

是的,您可以使用 XWiki Rendering 中的 HTML 解析器来解析维基百科生成的 HTML。这给了你一个 AST,你可以在上面做任何你想做的事情。

有关详细信息,请参阅http://rendering.xwiki.org/xwiki/bin/view/Main/WebHome 。

您只需要找到一种以 HTML 格式获取维基百科内容的方法。

于 2016-04-01T16:02:44.633 回答