似乎 PageRank 与 Wikidata 相比没有多大意义。显然,大类和大集合将成为领导者。
此外,与 Web 链接不同,RDF 谓词可以从双方“导航”。这只是设计问题,哪个 URI 是主题,哪个 URI 是对象。
然而,Andreas Thalhammer继续他的工作。排名前 10 位的 Wikidata 实体是:
物品 |
标签 |
秩 |
Q729 |
动物 |
24996.770 |
Q30 |
美国 |
24772.450 |
Q1360 |
节肢动物门 |
16930.883 |
Q1390 |
昆虫 |
16531.822 |
Q35409 |
家庭 |
14403.091 |
Q756 |
植物 |
14019.927 |
Q142 |
法国 |
13723.484 |
Q34740 |
属 |
13718.484 |
Q16 |
加拿大 |
12321.178 |
Q159 |
俄罗斯 |
11707.160 |
不幸的是,维基数据页面排名没有发布在(相同的)端点上,无法使用 SPARQL 查询它们。
幸运的是,一个人可以自己算出某种等级。可能的选项是:
- 输出报表的数量(预先计算);
- 附加链接数量(预先计算);
- 传入语句的数量(在下面的示例中,仅计算真实的语句)。
示例查询:
SELECT ?item ?itemLabel ?outcoming ?sitelinks ?incoming {
?item wdt:P463 wd:Q458 .
?item wikibase:statements ?outcoming .
?item wikibase:sitelinks ?sitelinks .
{
SELECT (count(?s) AS ?incoming) ?item WHERE {
?item wdt:P463 wd:Q458 .
?s ?p ?item .
[] wikibase:directClaim ?p
} GROUP BY ?item
}
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }.
} ORDER BY DESC (?incoming)
试试看!
截至 2017 年 10 月,所有这些指标或多或少是相关的。
以下是这些措施对欧盟成员国的相关系数。
皮尔逊 |
结果 |
附加链接 |
传入 |
网页排名 |
结果 |
1.0000 |
0.6907 |
0.7416 |
0.8652 |
附加链接 |
0.6907 |
1.0000 |
0.4314 |
0.5717 |
传入 |
0.7416 |
0.4314 |
1.0000 |
0.8978 |
网页排名 |
0.8652 |
0.5717 |
0.8978 |
1.0000 |
斯皮尔曼 |
结果 |
附加链接 |
传入 |
网页排名 |
结果 |
1.0000 |
0.6869 |
0.7619 |
0.8736 |
附加链接 |
0.6869 |
1.0000 |
0.7680 |
0.8342 |
传入 |
0.7619 |
0.7680 |
1.0000 |
0.8872 |
网页排名 |
0.8736 |
0.8342 |
0.8872 |
1.0000 |
肯德尔 |
结果 |
附加链接 |
传入 |
网页排名 |
结果 |
1.0000 |
0.4914 |
0.5661 |
0.7143 |
附加链接 |
0.4914 |
1.0000 |
0.5764 |
0.6454 |
传入 |
0.5661 |
0.5764 |
1.0000 |
0.7249 |
网页排名 |
0.7143 |
0.6454 |
0.7249 |
1.0000 |
也可以看看: