问题标签 [wikipedia-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
13519 浏览

sql - 如何获取维基百科类别及其子类别下的所有文章页面?

我想获取一个类别及其子类别下的所有文章名称。

我知道的选项:

  1. 使用维基百科 API。有这样的选择吗??
  2. d/l 转储。哪种格式更适合我的使用?
  3. 还有一个在 Wikipedia 中搜索类似的选项incategory:"music",但我没有看到在 XML 中查看的选项。

请分享你的想法

0 投票
2 回答
8088 浏览

api - 用于检索名人信息的 API

我正在寻找一些可调用的方式来获取有关名人和名人的信息。给定一个字符串,我想确定它是否是名人的名字,如果是,他们是否还活着,也许他们属于哪个类别(例如演员、音乐家、运动员)。

有谁知道任何公开可用的 API 来做这样的事情?我能想到的最好的是维基百科,但这很成问题,因为必须解析大部分信息,并且不是可靠和可预测的格式。

当最初的搜索没有结果时,我还希望能够为可能的名称提供建议(因为字符串将来自人并且可能包含拼写错误)。

0 投票
1 回答
7040 浏览

php - 如何获取维基百科页面的 HTML 内容文本(通过 Wikipedia API)?

我只想获取内容(没有链接,没有类别,没有图像......只是文字)

0 投票
4 回答
6515 浏览

android - 如何将部分维基百科内容检索到 Android 应用程序中?

基本上,我想从维基百科检索内容。但我想直接在我的 Android 应用程序中显示它。不是立即重定向到互联网浏览器,而是首先在我的应用程序中显示它。

目前,我设法通过使用http://en.wikipedia.org/w/api.php?action=parse&prop=text&format=xml&page=Bla_Bla_Bla请求 Wikipedia API 并仅获取主要内容。并且因为我解析数据,所以我将使用 WebView 在 Android 中进行渲染。它成功渲染。但仅限于那些不受保护的文章...

如果它受到Mona Lisa等保护,则输出未在 WebView Android 中正确呈现。

我想知道是否有人尝试检索维基百科内容并将其显示在您的 Android 应用程序中,轻松而美观?

谢谢 :)

0 投票
3 回答
5807 浏览

r - 如何从 R 访问维基百科?

是否有任何 R 包允许查询 Wikipedia(很可能使用 Mediawiki API)以获取与此类查询相关的可用文章列表,以及导入所选文章以进行文本挖掘?

0 投票
1 回答
723 浏览

mediawiki - MediaWiki API:如何获取文章的编辑列表

作为WP:ASE项目的一部分,我想获取编辑给定文章的编辑者列表。

例如,对于文章Szklarka Mielęcka (历史) 将是:
Kotbot, AnomieBOT, Xenobot

我在MediaWiki API中找不到任何东西。

有比抓取历史网页更好的主意吗?
下载历史数据转储不是解决方案,因为我没有资源来处理 5 TB 的文本。

规模:我想对大约 1000 篇随机文章进行此操作,每年两次。

0 投票
1 回答
1866 浏览

xpath - PHP + Wikipedia:从 Wikipedia 文章的第一段中获取内容?

我正在尝试使用 Wikipedia 的 API (api.php) 来获取由链接提供的 Wikipedia 文章的内容(例如:http ://en.wikipedia.org/wiki/Stackoverflow )。我想要的是获得第一段(在 Stackoverflow wiki 文章的示例中是:Stack Overflow 是 Stack Exchange 网络[2][3] 的一个网站部分,其中包含关于广泛主题的问题和答案计算机编程。[4][5][6])。

我打算用它做一些数据操作。

我尝试过使用 API 网址:http ://en.wikipedia.org/w/api.php?action=parse&page=Stackoverflow&format=xml但它给了我某种错误。它输出:

我找到了我尝试过的这段代码

但我无法获取变量 $wikiPage 中的 HTML 内容。

我不知道这是否是最好或最佳的方法,因此请随时对此发表评论,否则任何建议或解决方案将不胜感激。

谢谢
- 梅斯蒂卡

0 投票
3 回答
59394 浏览

wikipedia - 什么是维基百科 pageid?如何将其更改为真实页面网址?

我正在研究维基百科 API,

一些演示 api 调用

什么是pageid?如何将其更改为真实的页面网址?

我的意思是<page pageid="18630637" ns="0" title="Translation" />,如何18630637变成http://en.wikipedia.org/wiki/Translation

0 投票
2 回答
1924 浏览

php - 使用维基百科 API 获取内容

如何通过单个请求获取 Wikipedia 文章的整个第一部分/段落,包括第一张图片?

到目前为止我尝试过的(以下网址)只返回一个片段:

http://en.wikipedia.org/w/api.php?format=xml&action=query&list=search&srsearch=camera&srlimit=1

0 投票
1 回答
283 浏览

java - 如何在维基百科中的单词中获取类别?

我有关于在单词中提取类别的问题。我在一个集群中有几个词(“apple”、“iMac”、“snowleopard”),我想在这些词中检索类别。

("apple","iMac","snowleopard") --> "Mac OS X"

我尝试过使用 WordNet 等词汇数据库,但它不起作用。我一直在寻找其他方法,发现维基百科可能会有所帮助。任何用于维基百科的 Java 库?以及如何完成我上面提到的此类任务?谢谢