问题标签 [wikimedia]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 如何获取任何 wiki 页面的第一张图片
我需要在任何给定的 wiki 页面中获取第一个图像/主图像。我可以使用抓取工具来做到这一点。但我正在使用 curl 来废弃页面。但可能是由于互联网连接速度较慢,仅废弃一个 wiki 页面需要很长时间。除此之外,我需要根据用户的查询同时显示至少 7-8 个不同的 wiki 图像。
因此,为此使用 curl 毫无意义。我试过wiki api
但是我没有其他参数可以给这个列表排序。通常,此 api 返回的第一张图片不是您在页面顶部看到的主图片。有时图像离页面上下文太远。
我只需要为每个 wiki 标题显示一张图片。提前致谢。
php - 维基百科服务器 gzip 内容
wikimedia api 是否支持 gzip 编码。我正在使用 curl 来获取内容。我使用了接受 gzip 编码。但它似乎不起作用..
mediawiki - 有没有我可以在我自己的页面/站点中实现的 WikiEditor 插件
我的客户想要一个与 WikiEditor 相同的编辑器,它的所有功能都在他的网站上(框架几乎接近 codeigniter)。我通过实现 MediaWiki 看到了编辑器“WikiEditor”,但我无法将它单独放入我的页面中。希望有人在那里得到一些答案。
谢谢和问候, 拉杰什莫汉
mediawiki - 如何在 mediawiki 用户偏好中添加更多用户性别选项?
在 special:preferences mediawiki 用户可以在两种性别之间进行选择。对于我的 wiki,我想添加更多选项。例如:“变性人”,或“不关你的事”。这是可行的吗?
mysql - 用 Java 从 WikiMedia 数据库中读取 varbinary 值
我正在尝试使用以下代码获取 MySQL 查询(WikiMedia;“ varbinary 字段”)的结果:
不幸的是,“title”杀死了所有的德语“元音变音”(ä、ü、ö 等)
我怎么解决这个问题?
谢谢 :-)
hadoop - 用于 Wikipedia pagecount 数据集的 Hadoop
我想构建一个 Hadoop-Job,它基本上将 wikipedia pagecount-statistic作为输入并创建一个类似的列表
为此,我需要与每种语言相关的不同文章名称 - 即布鲁日(en,fr),Brügge(de),MediaWikiApi 查询 articlewise(http://en.wikipedia.org/w/api.php?action=query&titles =布鲁日&prop=langlinks&lllimit=500)。
我的问题是找到解决这个问题的正确方法。
我的草图方法是:
- 逐行处理pagecount文件(行示例'de Brugge 2 48824')
- 查询 MediaApi 并写入。like'en-Articlename: process-language-key:count'
- 将所有 en-Articlename-values 聚合到一行(也许在第二份工作中?)
现在,为每一行查询 MediaAPI 似乎相当不方便,但目前我无法找到更好的解决方案。
您认为当前的方法是否可行,或者您能想出不同的方法吗?
旁注:创建的作业链将用于对我的(小型)Hadoop-Cluster 进行一些时间测量,因此更改任务仍然可以
编辑: 这是我刚刚发现的一个非常相似的讨论..
php - 从 wikisource.org 站点获取数据
我正在尝试从该站点获取邮政编码:
http://pl.wikisource.org/wiki/Lista_kod%C3%B3w_pocztowych_w_Polsce
我的代码很简单:
但是,当我将 $postalCode 设置为 03-000(也是 01-000、05-000,但对于 07-000、61-000、62-000 有效)时,我收到错误消息:
页面地址正确,您可以在网络浏览器中复制并粘贴它,它可以工作。有任何想法吗?
wikipedia - 如何从 Wikimedia 标记中的 Wikipedia [[File:...]] 标签构造完整 URL?
[[File:...]]
给定维基媒体标记或信息框行中的标签,维基百科使用什么逻辑来生成文章中图像的完整 URL |image=...
?
url 似乎总是以 开头http://upload.wikimedia.org/wikipedia/commons/
,后跟两个似乎不可预测的 url 段,再加上可以从标签中预测的图像名称。
例如,
产量:
有没有办法以编程方式确定/6/6a
url 的一部分,或者这是在维基百科服务器上的查找?
另一个例子,在信息框中:
产量:
可以/b/b3
预测 URL 的部分吗?
谢谢!
ruby - Xpath:直到一个节点的所有节点(Wikiquote.org)
文件: http ://en.wikiquote.org/wiki/The_Matrix
我想获取第一部分的所有引号(//ul/li)(Neo 的引号)。
我不能这样做//ul[1]/li
,因为在某些 wikiquote 的页面中,引用以这种形式表示
代替
我试过这个来获得第一部分
但我无法仅获取第一部分的报价。你能帮帮我吗?
wikimedia - 如何检测维基媒体页面转储中的部分
我环顾四周试图回答这个问题,但无济于事。我正在解析 wikimedia 页面转储以处理某些页面(是的,我知道有几种工具可以解析 wikimedia 页面转储,但它们对我和我的解析器都不起作用)。
问题很简单。我知道如何检测一个部分的开始(例如“==External References==”)。这很容易。没有明确定义的是如何检测一个部分何时结束?例如,对于大多数部分,我可以扫描直到下一个部分标题开始,但这并不可靠。我查看了 wikimedia 关于部分的帮助页面,但它没有说明如何检测部分的结尾。