1

我刚刚开始掌握链接数据,当然还有 DBpedia,希望它对我的工作有所帮助。

我只是想写一些 SPARQL 查询来熟悉数据和技术,但我对结果感到震惊,我想知道我是否在这里没有得到核心概念。例如,如果我想让 DBpedia 给我一个所有国家的列表,我会天真地想象每个国家都是“类型” dbo:country,如果某物是“类型” dbo:country,那么肯定应该是一个国家。

所以,我猜想返回所有国家的天真的 SPARQL 查询只是

PREFIX dbo: <http://dbpedia.org/ontology/>

SELECT ?concept
WHERE {?concept a dbo:Country}

现在,这个查询返回了很多我对它的期望。现有国家、前国家、属于其他国家的国家,当然还有芬兰国家板球队。

等等,什么?!?!?!

为什么此查询会返回芬兰国家板球队?当然,这不可能是 Country 类型的实体,不是吗?让我看...

http://dbpedia.org/page/Finland_national_cricket_team

哦。可以。_


我对这是一个 DBpedia 错误的理解是否正确?所有链接数据是否都受到异常值的类似污染?我的意思是,在我的查询返回的内容中,还有更多奇怪的东西,比如英国的篮球队、印第安纳州民主党、美国驻巴基斯坦大使等等。这种污染是给定的,还是我只是在这里错过了一个观点?

4

1 回答 1

2

我对这是一个 DBpedia 错误的理解是否正确?

是的,我相信是的。如果你仔细观察,你会发现芬兰国家板球队dbo:countrydbr:Jonathan_October. 我不太明白为什么会这样,但我认为这是问题的根源。

所有链接数据是否都受到异常值的类似污染?

我不这么认为,它总是取决于数据的来源。但是,如果它类似于从维基百科自动提取的数据,总会有问题(尽管大多数时候希望不会达到这个规模)。

于 2015-10-10T01:28:00.643 回答