2

我正在开发一个 PHP 项目,在该项目中我为司法调查创建了一个更具可读性的文本记录版本,而我真正想做的一件事是拍摄每个演讲者的照片。

其中一些是公众人物(即英国著名的法官和律师;英国政客),另一些是记者,一些是名人。

似乎 Wikipedia 是最好的选择(但是我可能错了),但是,我真的不熟悉MediaWiki API

所以,我的问题:

  1. 维基百科是完成这项任务的最佳选择吗?或者在某个地方是否有一个包含各种主题的爆头数据库?如果是后者,它的 API 文档在哪里?
  2. 如果是 Wikipedia,我将使用什么 API 调用来获取文章的主图像 URL?
  3. 最后,我如何将像“SIR PAUL STEPHENSON”这样的字符串翻译成它在维基百科中的列出方式,即“ Paul_Stephenson_(police_officer)

请注意,我知道在维基百科上不存在照片或需要消除歧义的情况下会出现特殊情况——我很清楚我必须根据具体情况处理这些情况。

谢谢!

4

2 回答 2

1

谷歌图片有一个面部过滤器:

https://www.google.com/search?tbm=isch&q=SIR+PAUL+STEPHENSON&tbs=itp:face

我不确定是否允许您将他们的API用于此类内容,但您需要阅读他们的 TOS。

于 2012-03-14T01:26:41.943 回答
0

您可以使用搜索 api来查找最有可能的文章名称。AFAIK 虽然没有健全的 API 可以找到文章中的第一张图片(图片 api将按字母顺序返回图片,并包括来自模板的图片),所以最好的办法是解析 HTML(肖像通常是第一个大图像)或 wikitext(大多数信息框使用名为 的参数image)。您可以使用imageinfo api从图像页面名称中获取图像 URL。

总而言之,使用 Flickr 可能会更好。

于 2012-03-14T19:11:57.857 回答