问题标签 [wikipedia]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
573 浏览

.net - 维基百科嵌入 WinForms 应用教程

任何人都可以在此处发布有关如何在 .NET WinForms 应用程序(C# 或 VB)中显示 Wikipedia 文章的教程吗?如果文章可以放在一个字符串中就足够了,则无需将其放在任何控件上。

我在Wikipedia 的 API上找到了一些信息。阅读后,我添加了对 Web 服务的引用,但找不到使其工作的方法。

如果可能,请解释如何从 wiki 下载图像(链接或图像本身)。

0 投票
4 回答
9041 浏览

php - 使用 PHP 从 Wikipedia JSON 或 XML 中提取数据

我想使用 PHP(可能使用 Curl/XPath?)从 Wikipedia 页面中提取数据。解决此问题的最佳方法是什么?我将在这个项目中使用 CakePHP,虽然只需要先弄清楚如何让它工作。

0 投票
1 回答
590 浏览

parsing - 维基百科的 YQL 开放数据表

有没有人写过一个 YQL 开放数据表来访问维基百科?我在互联网上进行了搜索,发现有人提到有人使用 YQL 从维基百科页面中提取各种信息,例如微格式、链接或内容,但我无法找到将它们联系在一起的开放数据表.

0 投票
3 回答
1652 浏览

xml - 解析 Wiki XML Dumps ver0.4 变得很困难

我正在尝试使用“Parse-MediaWikiDump-1.0.4”和“Wikiprep.pl”脚本来解析 Wikipedia XML Dump。我猜这个脚本适用于ver0.3 Wiki XML Dumps,但不适用于最新的ver0.4 Dumps。我收到以下错误。

无法通过 wikiprep.pl 第 390 行的包“Parse::MediaWikiDump::Pages”定位对象方法“page”。

此外,在“Parse-MediaWikiDump-1.0.4”文档@ http://search.cpan.org/~triddle/Parse-MediaWikiDump-1.0.4/lib/Parse/MediaWikiDump/Pages.pm下,我阅读了“LIMITATIONS 0.4 版 此类已更新以支持来自 MediaWiki 实例的 0.4 版转储文件,但目前不支持这些文件中可用的任何新信息。”

任何解决方法都将帮助我更上一层楼。

注意:有人可能想知道为什么我们不能直接使用 SAX 或 STAX 解析器,wikipedia dump 是 25GB 加上单个文件,堆栈/内存问题很明显。因此,上面的 perl 脚本解决了这个问题,但目前我遇到了这个版本问题。

0 投票
1 回答
723 浏览

api - list=alllinks 混淆

我正在为夏天做一个研究项目,我必须使用从维基百科获取一些数据,存储它,然后对其进行一些分析。我正在使用 Wikipedia API 来收集数据,而且我已经很好地完成了。

我的问题是关于此处links-alllinksAPI文档中的选项的问题 在阅读了那里和API本身中的描述后(它有点低,我无法直接链接到该部分),我想我明白它应该是什么返回。但是,当我运行查询时,它给了我一些我没想到的东西。

这是我运行的查询:

其实质是:获取谷歌页面的最新修订,包括每个修订的id、时间戳、用户、评论和内容,并以XML格式返回。链接(我认为)应该给我一个指向谷歌页面的维基百科页面列表(在这种情况下是前 40 个唯一的页面)。

我不确定发誓的政策是什么,但这是我得到的结果:

<alllinks>部分,它只是一堆随机的狼吞虎咽和冒犯性的评论。几乎没有我想我会得到的。我进行了相当多的搜索,但我似乎无法找到我的问题的直接答案。

  1. list=alllinks期权应该返回什么?
  2. 为什么我会把这些垃圾放进去?
0 投票
3 回答
3595 浏览

javascript - 使用 jquery 读取维基百科 url 的内容,跨域网络调用

我想使用 jQuery 从我的域中读取 wikipedia 页面,我正在执行上述操作。正如预期的那样,维基百科将数据作为纯 html 发送,但是当我们使用 $.ajax 获取跨域数据时,它期望接收到的数据是 json 格式,因此我收到错误并且无法读取维基百科的响应。

请建议我如何使用 jquery/javascript 阅读 wikipedia url(不涉及任何服务器端技术)还有任何可用的 api,我可以通过它从 wikipedia 获取 json。

0 投票
1 回答
222 浏览

php - 每周同步两个 MediaWiki?

我们有两个 mediawiki(如维基百科)安装。一种是公开的,一种是内部的。

我们对内部添加/更改/删除文本文章和图片进行正常工作。

我们想每周同步和更新外部的,最好的方法是什么?

注意:我们正在使用 2 个 Windows 服务器(但愿意更改为 linux(1 或 2 个服务器设置),如果这样会更容易)

干杯

0 投票
2 回答
739 浏览

c++ - 调车场:缺少操作员的参数

我正在实施调车场算法。我无法检测何时缺少运算符的参数。维基百科条目在这个主题上非常糟糕,并且他们的代码在下面的示例中也崩溃了。

例如3 - (5 + )不正确,因为+缺少参数。

就在算法到达 之前),运算符堆栈包含- ( +并且操作数堆栈包含3 5。然后它是这样的:

  • +它从运算符堆栈中弹出
  • 发现这+是一个二元运算符
  • 弹出两个操作数,应用运算符并将结果 ( ) 推8送到操作数堆栈
  • 然后它(从堆栈中弹出匹配项,并继续

那么我怎样才能检测到+缺少参数呢?如果您还更新了维基百科,那就再好不过了 :-)

0 投票
8 回答
20649 浏览

wiki - 如何从 Wikipedia 获取 Infobox 数据?

如果我有一个页面的 url,我将如何使用 MediaWiki 网络服务获取右侧的 Infobox 信息?

0 投票
2 回答
756 浏览

scripting - 如何获取 Wikipedia 上文章的完整更改历史记录?

我想要一种方法来下载维基百科上热门文章历史中每一页的内容。换句话说,我想获得一篇文章的每次编辑的全部内容。我该怎么做呢?

有没有一种简单的方法可以使用 Wikipedia API 来做到这一点。我看了看,没有发现任何弹出的简单解决方案。我还查看了 PyWikipedia Bot 页面 ( http://botwiki.sno.cc/w/index.php?title=Template:Script&oldid=3813 ) 上的脚本,但没有找到任何有用的东西。用 Python 或 Java 做一些简单的方法是最好的,但我愿意接受任何可以让我获得数据的简单解决方案。