我正在尝试从 wiki travel 中获取特定数据。像气候,getin 等。我已经设法通过特殊导出从他们那里获取 xml。
http://wikitravel.org/en/Special:Export/San_Francisco 我以 xml 格式获取数据,但它在 wiki 标记中,我尝试浏览以获取该文本的解决方案,但无法找到合适的解决方案。
我尝试使用正则表达式编写一个 php 函数,以便将其转换为 html,但它以非统一的方式转换,因此很难选择特定数据。
还尝试编写 mediawiki url,以便我可以编写一些东西 http://wikitravel.org/en/api.php?format=xml&action=query&titles=Main%20Page&prop=revisions&rvprop=content 但它不起作用。
你能帮我解决这个问题吗?有没有人成功爬过维基百科。我有一个教程或任何其他我可以参考的技术。