问题标签 [wikipedia]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1692 问题

0 投票

2 回答

573 浏览

.net - 维基百科嵌入 WinForms 应用教程

任何人都可以在此处发布有关如何在 .NET WinForms 应用程序（C# 或 VB）中显示 Wikipedia 文章的教程吗？如果文章可以放在一个字符串中就足够了，则无需将其放在任何控件上。

我在Wikipedia 的 API上找到了一些信息。阅读后，我添加了对 Web 服务的引用，但找不到使其工作的方法。

如果可能，请解释如何从 wiki 下载图像（链接或图像本身）。

2010-05-26T13:46:19.367

0 投票

4 回答

9041 浏览

php - 使用 PHP 从 Wikipedia JSON 或 XML 中提取数据

我想使用 PHP（可能使用 Curl/XPath？）从 Wikipedia 页面中提取数据。解决此问题的最佳方法是什么？我将在这个项目中使用 CakePHP，虽然只需要先弄清楚如何让它工作。

php xpath curl wikipedia

2010-05-29T21:25:16.413

0 投票

1 回答

590 浏览

parsing - 维基百科的 YQL 开放数据表

有没有人写过一个 YQL 开放数据表来访问维基百科？我在互联网上进行了搜索，发现有人提到有人使用 YQL 从维基百科页面中提取各种信息，例如微格式、链接或内容，但我无法找到将它们联系在一起的开放数据表.

parsing wikipedia yql

2010-05-30T14:26:46.040

0 投票

3 回答

1652 浏览

xml - 解析 Wiki XML Dumps ver0.4 变得很困难

我正在尝试使用“Parse-MediaWikiDump-1.0.4”和“Wikiprep.pl”脚本来解析 Wikipedia XML Dump。我猜这个脚本适用于ver0.3 Wiki XML Dumps，但不适用于最新的ver0.4 Dumps。我收到以下错误。

无法通过 wikiprep.pl 第 390 行的包“Parse::MediaWikiDump::Pages”定位对象方法“page”。

此外，在“Parse-MediaWikiDump-1.0.4”文档@ http://search.cpan.org/~triddle/Parse-MediaWikiDump-1.0.4/lib/Parse/MediaWikiDump/Pages.pm下，我阅读了“LIMITATIONS 0.4 版此类已更新以支持来自 MediaWiki 实例的 0.4 版转储文件，但目前不支持这些文件中可用的任何新信息。”

任何解决方法都将帮助我更上一层楼。

注意：有人可能想知道为什么我们不能直接使用 SAX 或 STAX 解析器，wikipedia dump 是 25GB 加上单个文件，堆栈/内存问题很明显。因此，上面的 perl 脚本解决了这个问题，但目前我遇到了这个版本问题。

xml perl parsing mediawiki wikipedia

2010-06-05T16:51:36.447

0 投票

1 回答

723 浏览

api - list=alllinks 混淆

我正在为夏天做一个研究项目，我必须使用从维基百科获取一些数据，存储它，然后对其进行一些分析。我正在使用 Wikipedia API 来收集数据，而且我已经很好地完成了。

我的问题是关于此处links-alllinksAPI文档中的选项的问题在阅读了那里和API本身中的描述后（它有点低，我无法直接链接到该部分），我想我明白它应该是什么返回。但是，当我运行查询时，它给了我一些我没想到的东西。

这是我运行的查询：

其实质是：获取谷歌页面的最新修订，包括每个修订的id、时间戳、用户、评论和内容，并以XML格式返回。链接（我认为）应该给我一个指向谷歌页面的维基百科页面列表（在这种情况下是前 40 个唯一的页面）。

我不确定发誓的政策是什么，但这是我得到的结果：

这<alllinks>部分，它只是一堆随机的狼吞虎咽和冒犯性的评论。几乎没有我想我会得到的。我进行了相当多的搜索，但我似乎无法找到我的问题的直接答案。

list=alllinks期权应该返回什么？
为什么我会把这些垃圾放进去？

api wikipedia wikipedia-api wikimedia

2010-06-09T10:20:01.887

0 投票

3 回答

3595 浏览

javascript - 使用 jquery 读取维基百科 url 的内容，跨域网络调用

我想使用 jQuery 从我的域中读取 wikipedia 页面，我正在执行上述操作。正如预期的那样，维基百科将数据作为纯 html 发送，但是当我们使用 $.ajax 获取跨域数据时，它期望接收到的数据是 json 格式，因此我收到错误并且无法读取维基百科的响应。

请建议我如何使用 jquery/javascript 阅读 wikipedia url（不涉及任何服务器端技术）还有任何可用的 api，我可以通过它从 wikipedia 获取 json。

javascript jquery cross-domain wikipedia

2010-06-26T09:09:58.660

0 投票

1 回答

222 浏览

php - 每周同步两个 MediaWiki？

我们有两个 mediawiki（如维基百科）安装。一种是公开的，一种是内部的。

我们对内部添加/更改/删除文本文章和图片进行正常工作。

我们想每周同步和更新外部的，最好的方法是什么？

注意：我们正在使用 2 个 Windows 服务器（但愿意更改为 linux（1 或 2 个服务器设置），如果这样会更容易）

干杯

php mysql mediawiki wikipedia

2010-07-07T09:10:20.580

0 投票

2 回答

739 浏览

c++ - 调车场：缺少操作员的参数

我正在实施调车场算法。我无法检测何时缺少运算符的参数。维基百科条目在这个主题上非常糟糕，并且他们的代码在下面的示例中也崩溃了。

例如3 - (5 + )不正确，因为+缺少参数。

就在算法到达之前)，运算符堆栈包含- ( +并且操作数堆栈包含3 5。然后它是这样的：

+它从运算符堆栈中弹出
发现这+是一个二元运算符
弹出两个操作数，应用运算符并将结果 ( ) 推8送到操作数堆栈
然后它(从堆栈中弹出匹配项，并继续

那么我怎样才能检测到+缺少参数呢？如果您还更新了维基百科，那就再好不过了 :-)

c++algorithm parsing wikipedia shunting-yard

2010-07-20T16:06:29.850

0 投票

8 回答

20649 浏览

wiki - 如何从 Wikipedia 获取 Infobox 数据？

如果我有一个页面的 url，我将如何使用 MediaWiki 网络服务获取右侧的 Infobox 信息？

wiki mediawiki wikipedia

2010-07-22T18:56:14.467

0 投票

2 回答

756 浏览

scripting - 如何获取 Wikipedia 上文章的完整更改历史记录？

我想要一种方法来下载维基百科上热门文章历史中每一页的内容。换句话说，我想获得一篇文章的每次编辑的全部内容。我该怎么做呢？

有没有一种简单的方法可以使用 Wikipedia API 来做到这一点。我看了看，没有发现任何弹出的简单解决方案。我还查看了 PyWikipedia Bot 页面 ( http://botwiki.sno.cc/w/index.php?title=Template:Script&oldid=3813 ) 上的脚本，但没有找到任何有用的东西。用 Python 或 Java 做一些简单的方法是最好的，但我愿意接受任何可以让我获得数据的简单解决方案。

scripting wikipedia web-scraping

2010-07-26T00:35:53.010

1 2 3 4 5 6 7 8 9 10

问题标签 [wikipedia]

Reference