3

我对 API 完全陌生,如果这个问题很愚蠢,我很抱歉。

我想在 Commons 中的一个类别中获取所有图像,比如说 X,但排除那些也在另一个 (Y) 中的图像。我不明白我是否真的可以做到这一点。

https://commons.wikimedia.org/w/api.php?action=query&list=categorymembers&cmtype=file&cmtitle=Category:X

将得到所有这些,如何排除一些?

此外,我希望在结果中包含图像的描述,而不仅仅是文件的名称,这可能吗?

4

2 回答 2

2

MediaWiki - 默认情况下 - 没有对类别构建和查询交叉点的内置支持。要完成此任务,需要扩展或外部工具或多个 API 查询和结果处理。

卷云搜索 API

在 Wikimedia Commons 上,就像在整个 Wikimedia Wiki 农场上一样,CirrusSearch支持过滤搜索,包括搜索类别交叉点,并且还可以通过 APIaction=query&list=search&srsearch=incategory:A+-incategory:B,这是Category:A减号Category:B)获得。

快速CCI

我可以推荐的工具之一(因为它是专用的高性能解决方案并且实际运行)是由 Daniel Schwen 开发的 fastcci;特别是对于 Wikimedia Commons,已经维护了一个数据库并运行了一个 Web 服务,但可以为任何 wiki 设置它,前提是该工具集有一个可以运行的主机并具有数据库访问权限。

FastCCI 在行动

询问

考虑以下查询 URL:

https://fastcci.wmflabs.org/?c1=3302993&c2=15516712&d1=0&d2=0&s=200&a=not&t=js

  • https://fastcci.wmflabs.org/ - 主持维基共享资源 fastcci 运行
  • c1 - 类别 1 的 ID
  • c2 - 类别 2 的 ID
  • d1 - 类别 1 的搜索深度(fastcci 默认考虑子类别)
  • d2 - 要搜索的类别 2 的深度(fastcci 默认考虑子类别)
  • s - 要返回的数字或结果
  • o - 偏移量
  • a - 连词
  • t - 连接类型(t=js用于 JSONP 响应;否则假定用作 websocket)

回复

fastcciCallback( [ 'RESULT 27572680,0,0|1675043,0,0|27577015,0,0|27577043,0,0|27577106,0,0|27576896,0,0|27576790,0,0|23481936,0,0|17560964,0,0|11009066,0,0', 'OUTOF 10', 'DBAGE 378310', 'DONE'] );

RESULT后跟一个由|最多 50 个整数三元组组成的分隔列表pageId,depth,tag。每个三元组代表一个图像或类别

资源

关于 pageID 的说明

于 2015-02-11T01:48:25.550 回答
1

AFAIK,没有办法直接使用 API 来获得它。但是,假设这两个类别都相当小,您可以从这两个类别中获取所有图像,然后在代码中计算补码。

要检索描述,您可以使用prop=imageinfo&iiprop=extmetadata&iiextmetadatafilter=ImageDescription.

在您的示例查询的上下文中,它看起来像这样:

https://commons.wikimedia.org/w/api.php?action=query&generator=categorymembers&gcmtype=file&gcmtitle=Category:X&prop=imageinfo&iiprop=extmetadata&iiextmetadatafilter=ImageDescription

于 2014-12-12T00:59:19.830 回答