问题标签 [mediawiki-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何从 R 访问维基百科?
是否有任何 R 包允许查询 Wikipedia(很可能使用 Mediawiki API)以获取与此类查询相关的可用文章列表,以及导入所选文章以进行文本挖掘?
php - 如何从 mediwiki 获取数据
您好我正在使用以下 api 从 mediawiki 获取数据。当我复制这个 url 并将其粘贴到浏览器中时,会出现一个 xml 响应。 http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=API|Main_Page&rvprop=timestamp|user|comment|content
但是当我尝试使用 curl 时,它给了我错误“脚本应该使用带有联系信息的信息用户代理字符串,否则它们可能会在没有通知的情况下被 IP 阻止。”。
我为此使用以下代码。任何人都可以追踪我的错误吗?
mediawiki - 从 mediawiki 获取特定的近期变化
我对 wiki 很陌生,但我想知道是否有可能基本上抓取每个页面的最新(顶部)最近更改并将其放入某种提要或任何可用格式,即每个页面最近更改的列表. 提前致谢。
search - 维基百科 API 调用不区分大小写
我正在尝试为我的 Wikipedia api 调用添加不区分大小写的功能。维基百科在命名页面时区分大小写。因此,http://en.wikipedia.org/wiki/Cat
将产生一个关于动物的页面,http://en.wikipedia.org/wiki/CAT
将产生一个消歧页面,http://en.wikipedia.org/wiki/CAt
并将产生一个页面不存在的通知。
我目前的问题是我想使用 API 以与 Wikipedia 相同的方式返回页面。我目前在 Python 中使用以下 API 调用:
当使用 GUI 的搜索框在 Wikipedia 上搜索时,“cat”和“CAt”将返回关于动物的页面,而“cAT”和“CAT”将返回消歧页面。
如何通过 API 复制此行为?
mediawiki - 使用 MediaWiki API 获取随机 SVG 图像
是否可以使用 MediaWiki API 返回随机图像?如果是这样,我可以指定一个文件类型,如 SVG 吗?
jquery - 显示来自 MediaWiki API 请求的数据
我使用.getJSON()
MediaWiki API 从维基百科中提取信息。我不知道如何处理我得到的数据。例如,如何显示文本内容?我试过.text()
在下面使用,但我有点无能为力。
javascript - 在客户端将 wikitext(维基词典风格)翻译成 HTML
我正在尝试在客户端(使用 JavaScript)解析维基词典。我找到了 Wiky.js,但它在一些标记方面存在问题,如 {{}}、+ 等。你知道任何可以帮助我的 JavaScript 库吗?我发现,MediaWiki API可以将 wikitext 翻译成 HTML。但我使用查询操作从 API 获取数据,因此请求服务器两次是虚拟的。也许有一些方法可以使用查询操作来获取 HTML 而不是 Wikitext?我还找到了render action,但它向我发送了整个页面,而不仅仅是一篇文章。
//编辑
这是示例 Wikitext 的一部分:
和 Wiky.toHtml() 输出:
wikipedia - Wikipedia API:如何获取页面的修订数?
任何人都知道如何使用 mediawiki API 获取维基百科页面的修订数量?我已阅读此 API 文档,但找不到相关 API:
Revision API
java - HttpClient 和非 ASCII URL 字符 (á,é,í,ó,ú)
'老读者,第一次海报'在这里。
我正在为我管理的西班牙语 Wiki 制作机器人。我想从头开始制作它,因为我制作它的目的之一是练习 Java。但是,在尝试使用 HttpClient 向包含非 ASCII 字符(如 á、é、í、ó 或 ú)的 URI 发出 GET 请求时,我遇到了一些麻烦。
当我执行上述操作时,GetMethod 抱怨 URI:
请注意,在堆栈跟踪中显示的 URI 中,空格被编码%20
,而í
s 保持原样。完全相同的 URI 在浏览器上完美运行,但我无法绕过 GetMethod 接受它。
我也尝试过执行以下操作:
这样,URI
转义了i
s,但双重转义了空格 ( %2520
) ...
现在,如果我在查询中不使用任何空格,则没有双重转义,并且我得到了所需的输出。因此,如果没有任何非 ASCII 字符的可能性,我就不需要使用URI
该类并且不会进行双重转义。为了避免空间的第一次转义,我尝试了这个:
但是URI
全班不喜欢它:
任何有关如何避免这种双重转义的输入将不胜感激。我一直潜伏在周围,完全没有运气。
谢谢!
编辑:最适合我的解决方案是 parsifal 的解决方案,但是,作为补充,我想说的是,设置路径时会method.setPath(url)
拒绝HttpMethod
我需要保存的 cookie:
但是,如果我将 URI 发送到构造函数而忘记了setPath(url)
,则 cookie 将毫无问题地保存。