1

我想从维基百科中提取类型信息。例如,我想找到:

  • 所有“卡罗莱纳黑豹队球员”的名单
  • 所有“颜色”的列表
  • 所有“NFL球队”的名单
  • 所有“月份”的列表

如果有一种干净的方法可以做到这一点,有什么想法吗?

显然,一种替代方法是使用 API,但据我所知,使用现有 API 从 Wiki 中提取此类信息并非易事。

4

3 回答 3

1

您似乎需要从 Wikipedia 中提取所有类别并构建类别分类法。构建类别分类后,您也可以检索相关类别。

使用类别信息,您还可以检索与特定类别关联的所有 Wikipedia 文章。

我相信我关于挖掘维基百科的项目可能会在这方面对你有所帮助。我已经对公开可用的维基百科文章和类别进行了预处理信息。

于 2016-12-22T10:02:56.103 回答
0

看起来维基百科有一个 API。我将从这里开始:

https://m.mediawiki.org/wiki/API:Main_page

于 2016-12-22T05:05:05.320 回答