2

我注意到有不同数量的三元组使用isbn关于一本书的相同属性(例如,),但来自不同的来源。例如,

http://dbpedia.org/property/isbn链接总数为 20885,而http://dbpedia.org/ontology/isbn
链接总数为 21132。

为什么这些数字不同?我想知道哪个适合获得良好的信息增益。

4

1 回答 1

2

尽管它们具有相似的名称,并且表示大致相同的信息,但属性并不相同。一个是“http://dbpedia.org/property/isbn ,另一个是“http://dbpedia.org/ontology/isbn

来自 DBpedia wiki 的第 4.3 节 Infobox Data说,http://dbpedia.org/property/命名空间中的属性包含原始信息框数据,并在较旧的Infobox Dataset中使用:

提取的信息使用命名空间中的属性表示http://dbpedia.org/property/。这些属性的名称直接反映了 Wikipedia infobox 属性的名称。属性名称不会被清理或合并。属性类型不是包含层次结构的一部分,并且信息框数据集没有一致的本体。

它还说较新的Infobox Ontology使用http://dbpedia.org/ontology/命名空间中的属性:

属性使用遵循http://dbpedia.org/ontology/{propertyname}命名模式的属性表示。

虽然Infobox Ontology包含的信息不如Infobox Dataset多,但信息更清晰:

因此,信息框本体中的实例数据比信息框数据集更清晰、结构更好,但目前并未涵盖维基百科中的所有信息框类型和信息框属性。

但是,在这种情况下,使用 ontology 属性的三元组似乎比使用 dataset 属性的三元组多,因此您应该使用http://dbpedia.org/ontology/isbn而不是http://dbpedia.org/property/isbn.

于 2013-06-09T21:18:01.617 回答