1

我目前正在使用适用于 python 的 SPARQLWrapper 从 DBpedia 文章中提取数据,但我似乎无法找到如何提取给定文章的观察者数量(和其他统计信息)。

有没有简单的方法来实现这一目标?我不介意它是通过 DBpedia 还是直接通过 wikipedia(例如使用 wget)。

感谢您的任何建议。

4

1 回答 1

4

禁止获取每篇任意文章的观察者数量,因为如果每个人都可以找到未观察的页面,则被认为是安全漏洞。例如,只有特权用户才能访问Special:Unwatched Pages。有一个工具服务器工具(可以访问数据库)显示观察者的数量,但出于同样的原因,它仅限于具有超过 30 个观察者的页面- 至少未经身份验证。

MediaWiki 查询 API公开有关文章的大部分内容和状态信息,但您也可以查询和评估公共日志修订历史记录,以获取有关(公共)用户操作的统计数据。有关 Wikimedia 站点的更多统计信息,您可以查看Meta:Statistics ,其中列出了各种数据源(主要是http://stats.wikimedia.org/ )和它们的可视化。

于 2012-12-20T18:15:53.687 回答