2

我一直在努力使用它的 API 从 Wikipedia 获取书籍作者列表。我想让我网站的用户能够展示他们喜欢的作家。为了向他们展示喜欢同一个作家的其他人,我认为制作一个自动完成/建议文本框来向他们展示可能的作家是个好主意(之后,假设输入 3 个字符)。这样,可以避免拼写问题,而且我可以存储 pageId,然后我可以使用它来匹配用户。

编码不是问题!问题在于构建正确的查询。我尝试了几种方法,但我无法得到我想要的。也很少有例子可以说明如何做这种事情。

我想要什么:

  • 返回页面的标题
  • 仅页面(因此没有类别、修订等)
  • 关于人的页面,或者如果可能的话作家(国籍不重要)
  • 仅搜索标题

如果可能的话:

  • 页面上的一些文字(我想只能在维基百科上得到这个?)
  • 页面的 url
  • 出生日期,以及适当的死亡日期

我不确定这是否可能。

4

1 回答 1

0

如今,查询 Wikipedia 数据是通过其结构化数据对应物 Wikidata 完成的。https://www.wikidata.org/wiki/Wikidata:Data_access

例如,您可以使用 WDQ 获取标记为“存在”或“具有”“作家”职业的项目列表:http ://tools.wmflabs.org/autolist/autolist1.html?q=tree%5B36180 %5D%5B%5D%5B31%2C106%5D(60k 结果)。

或者还包括其所有子类(诗人和其他):http ://tools.wmflabs.org/autolist/autolist1.html?q=tree%5B36180%5D%5B%5D%5B31%2C106%2C279%5D (获取200k 结果有点混乱,需要一些过滤)。

于 2015-07-25T17:15:53.927 回答