问题标签 [wikimedia]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

146 问题

0 投票

4 回答

3569 浏览

php - 如何获取任何 wiki 页面的第一张图片

我需要在任何给定的 wiki 页面中获取第一个图像/主图像。我可以使用抓取工具来做到这一点。但我正在使用 curl 来废弃页面。但可能是由于互联网连接速度较慢，仅废弃一个 wiki 页面需要很长时间。除此之外，我需要根据用户的查询同时显示至少 7-8 个不同的 wiki 图像。

因此，为此使用 curl 毫无意义。我试过wiki api

但是我没有其他参数可以给这个列表排序。通常，此 api 返回的第一张图片不是您在页面顶部看到的主图片。有时图像离页面上下文太远。

我只需要为每个 wiki 标题显示一张图片。提前致谢。

2012-04-20T14:47:41.127

0 投票

3 回答

155 浏览

php - 维基百科服务器 gzip 内容

wikimedia api 是否支持 gzip 编码。我正在使用 curl 来获取内容。我使用了接受 gzip 编码。但它似乎不起作用..

php curl wikimedia

2012-05-04T11:15:26.767

0 投票

1 回答

86 浏览

mediawiki - 有没有我可以在我自己的页面/站点中实现的 WikiEditor 插件

我的客户想要一个与 WikiEditor 相同的编辑器，它的所有功能都在他的网站上（框架几乎接近 codeigniter）。我通过实现 MediaWiki 看到了编辑器“WikiEditor”，但我无法将它单独放入我的页面中。希望有人在那里得到一些答案。

谢谢和问候，拉杰什莫汉

mediawiki wikimedia

2012-05-21T06:50:52.813

0 投票

2 回答

160 浏览

mediawiki - 如何在 mediawiki 用户偏好中添加更多用户性别选项？

在 special:preferences mediawiki 用户可以在两种性别之间进行选择。对于我的 wiki，我想添加更多选项。例如：“变性人”，或“不关你的事”。这是可行的吗？

mediawiki wikimedia

2012-06-24T06:59:06.673

0 投票

1 回答

228 浏览

mysql - 用 Java 从 WikiMedia 数据库中读取 varbinary 值

我正在尝试使用以下代码获取 MySQL 查询（WikiMedia；“ varbinary 字段”）的结果：

不幸的是，“title”杀死了所有的德语“元音变音”（ä、ü、ö 等）

我怎么解决这个问题？

谢谢：-）

mysql wikipedia wikimedia

2012-09-28T21:26:12.360

0 投票

1 回答

991 浏览

hadoop - 用于 Wikipedia pagecount 数据集的 Hadoop

我想构建一个 Hadoop-Job，它基本上将 wikipedia pagecount-statistic作为输入并创建一个类似的列表

为此，我需要与每种语言相关的不同文章名称 - 即布鲁日（en，fr），Brügge（de），MediaWikiApi 查询 articlewise（http://en.wikipedia.org/w/api.php?action=query&titles =布鲁日&prop=langlinks&lllimit=500)。

我的问题是找到解决这个问题的正确方法。

我的草图方法是：

逐行处理pagecount文件（行示例'de Brugge 2 48824'）
查询 MediaApi 并写入。like'en-Articlename: process-language-key:count'
将所有 en-Articlename-values 聚合到一行（也许在第二份工作中？）

现在，为每一行查询 MediaAPI 似乎相当不方便，但目前我无法找到更好的解决方案。

您认为当前的方法是否可行，或者您能想出不同的方法吗？

旁注：创建的作业链将用于对我的（小型）Hadoop-Cluster 进行一些时间测量，因此更改任务仍然可以

编辑：这是我刚刚发现的一个非常相似的讨论..

hadoop mapreduce wikipedia concept wikimedia

2012-10-14T12:42:11.260

0 投票

1 回答

325 浏览

php - 从 wikisource.org 站点获取数据

我正在尝试从该站点获取邮政编码：

http://pl.wikisource.org/wiki/Lista_kod%C3%B3w_pocztowych_w_Polsce

我的代码很简单：

但是，当我将 $postalCode 设置为 03-000（也是 01-000、05-000，但对于 07-000、61-000、62-000 有效）时，我收到错误消息：

页面地址正确，您可以在网络浏览器中复制并粘贴它，它可以工作。有任何想法吗？

php wikimedia

2012-11-25T20:11:23.990

0 投票

1 回答

809 浏览

wikipedia - 如何从 Wikimedia 标记中的 Wikipedia [[File:...]] 标签构造完整 URL？

[[File:...]]给定维基媒体标记或信息框行中的标签，维基百科使用什么逻辑来生成文章中图像的完整 URL |image=...？

url 似乎总是以开头http://upload.wikimedia.org/wikipedia/commons/，后跟两个似乎不可预测的 url 段，再加上可以从标签中预测的图像名称。

例如，

产量：

有没有办法以编程方式确定/6/6aurl 的一部分，或者这是在维基百科服务器上的查找？

另一个例子，在信息框中：

产量：

可以/b/b3预测 URL 的部分吗？

谢谢！

wikipedia wikimedia

2012-11-30T03:29:54.447

0 投票

3 回答

643 浏览

ruby - Xpath：直到一个节点的所有节点（Wikiquote.org）

文件： http ://en.wikiquote.org/wiki/The_Matrix

我想获取第一部分的所有引号（//ul/li）（Neo 的引号）。

我不能这样做//ul[1]/li，因为在某些 wikiquote 的页面中，引用以这种形式表示

代替

我试过这个来获得第一部分

但我无法仅获取第一部分的报价。你能帮帮我吗？

ruby xpath nokogiri xpath-2.0 wikimedia

2012-12-16T16:33:51.887

0 投票

1 回答

47 浏览

wikimedia - 如何检测维基媒体页面转储中的部分

我环顾四周试图回答这个问题，但无济于事。我正在解析 wikimedia 页面转储以处理某些页面（是的，我知道有几种工具可以解析 wikimedia 页面转储，但它们对我和我的解析器都不起作用）。

问题很简单。我知道如何检测一个部分的开始（例如“==External References==”）。这很容易。没有明确定义的是如何检测一个部分何时结束？例如，对于大多数部分，我可以扫描直到下一个部分标题开始，但这并不可靠。我查看了 wikimedia 关于部分的帮助页面，但它没有说明如何检测部分的结尾。

wikimedia

2013-01-05T23:33:59.280

1 2 3 4 5 6 7 8 9 10