我想获取维基百科页面的内容,然后用它做一些有趣的事情。
我的想法是我想以 XML/JSON 格式获取它们,而目前我似乎没有找到一种方法来做到这一点。
目前我成功地做到了这一点:
但是我收到了 XWiki 中的内容,但由于页面不支持它,我无法将其更改为 JSON。
如何将 XWiki 解析为 JSON 或如何获取页面内容。
谢谢!
我想获取维基百科页面的内容,然后用它做一些有趣的事情。
我的想法是我想以 XML/JSON 格式获取它们,而目前我似乎没有找到一种方法来做到这一点。
目前我成功地做到了这一点:
但是我收到了 XWiki 中的内容,但由于页面不支持它,我无法将其更改为 JSON。
如何将 XWiki 解析为 JSON 或如何获取页面内容。
谢谢!
是的,您可以使用 XWiki Rendering 中的 HTML 解析器来解析维基百科生成的 HTML。这给了你一个 AST,你可以在上面做任何你想做的事情。
有关详细信息,请参阅http://rendering.xwiki.org/xwiki/bin/view/Main/WebHome 。
您只需要找到一种以 HTML 格式获取维基百科内容的方法。