当我给出维基百科页面的标题时,我想要纯文本格式的页面内容。没有图像,没有标记等。
我一直在浏览 Wikipedia API,但找不到任何相关结果。
鉴于任务的简单性,我确信 Wikipedia API 支持这一点。
那么,我该如何实现呢?
当我给出维基百科页面的标题时,我想要纯文本格式的页面内容。没有图像,没有标记等。
我一直在浏览 Wikipedia API,但找不到任何相关结果。
鉴于任务的简单性,我确信 Wikipedia API 支持这一点。
那么,我该如何实现呢?
像这样 :
<script src="http://code.jquery.com/jquery-1.9.0.min.js"></script>
<script>
function wiktext() {
var title = prompt("Enter the title:","Title of Wikipedia Page to get");
var address = "http://en.wikipedia.org/w/api.php?format=txt&action=query&prop=revisions&rvprop=content&titles=" + encodeURIComponent(title);
$.get(address, function(result) {
console.log(result);
});
}
wiktext();
</script>
但是请注意,这是维基标记文本。并且您需要去掉描述嵌套数据结构的标题的前几行。
然后,您可以使用remy sharp 的这个 Wiki 到 HTML 解析器来删除大多数 wiki 内容并为您提供一些 HTML。然后只需在将 HTML 放入的元素上使用 jquery 的 .text() 方法即可。
有关更多信息,请参阅此处的 API 文档