我想从维基百科中提取类型信息。例如,我想找到:
- 所有“卡罗莱纳黑豹队球员”的名单
- 所有“颜色”的列表
- 所有“NFL球队”的名单
- 所有“月份”的列表
如果有一种干净的方法可以做到这一点,有什么想法吗?
显然,一种替代方法是使用 API,但据我所知,使用现有 API 从 Wiki 中提取此类信息并非易事。
我想从维基百科中提取类型信息。例如,我想找到:
如果有一种干净的方法可以做到这一点,有什么想法吗?
显然,一种替代方法是使用 API,但据我所知,使用现有 API 从 Wiki 中提取此类信息并非易事。
您似乎需要从 Wikipedia 中提取所有类别并构建类别分类法。构建类别分类后,您也可以检索相关类别。
使用类别信息,您还可以检索与特定类别关联的所有 Wikipedia 文章。
我相信我关于挖掘维基百科的项目可能会在这方面对你有所帮助。我已经对公开可用的维基百科文章和类别进行了预处理信息。
通过 MediaWiki api 提取的信息:
-- 所有“Carolina Panthers 球员”列表 https://en.wikipedia.org/w/api.php?action=query&list=categorymembers&cmtitle=Category:Carolina_Panthers_players&cmlimit=100
看起来维基百科有一个 API。我将从这里开始: