4

为什么 DBpedia 对相同的属性使用多个词汇表?
我必须获取所有可能电影的数据。对于我观察到的每部电影,它都有一个 dbpedia-owl 和一个用于制片人、导演等的 dbpprop 词汇表。我使用以下查询检索属性:

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>

PREFIX foaf: <http://xmlns.com/foaf/0.1/>

SELECT ?star_name 
WHERE { 
<http://dbpedia.org/resource/Goal_III:_Taking_on_the_World> dbpedia-owl:starring ?star.
?star foaf:name ?star_name 
}

我将获得每部电影的页面 ID,然后我将检索明星和制片人。对于一些我认为 dbpedia-owl 有效,而对于一些 dbpprop 有效。

我对此感到困惑。我必须用 Python 编写代码来为每部电影运行这个查询。因此,每次我都必须检查结果是否为空,然后运行其他词汇表的代码。

4

1 回答 1

1

DBPedia 的数据是使用基于映射的语言从您在相应维基百科页面上看到的信息框中提取的。不同的映射用于不同的信息框,因此两种不同类型的资源的映射可能完全不同,如果您考虑一下,这是完全合乎逻辑的。

现在您正在谈论的问题是具有相同数据的相同类型的两个资源映射不同。我怀疑(虽然无法确认,因为您没有给出两部电影的不同映射属性的示例)这里的问题是维基百科中的数据。可能有不止一种方法可以在信息框中表达您感兴趣的信息,并且信息框的映射以不同的方式映射。这并不理想,但 Wikipedia 没有可爱的干净数据,因此您也不应该期望 DBPedia 也有干净的数据。

您可以考虑在 dbpedia-discussion@lists.sf.net 上的 DBPedia 邮件列表上询问有关此问题的问题,尝试找出发生这种情况的原因,因为他们将更好地为您提供帮助。

于 2011-12-20T00:13:56.490 回答