我注意到有不同数量的三元组使用isbn
关于一本书的相同属性(例如,),但来自不同的来源。例如,
http://dbpedia.org/property/isbn链接总数为 20885,而http://dbpedia.org/ontology/isbn
链接总数为 21132。
为什么这些数字不同?我想知道哪个适合获得良好的信息增益。
我注意到有不同数量的三元组使用isbn
关于一本书的相同属性(例如,),但来自不同的来源。例如,
http://dbpedia.org/property/isbn链接总数为 20885,而http://dbpedia.org/ontology/isbn
链接总数为 21132。
为什么这些数字不同?我想知道哪个适合获得良好的信息增益。
尽管它们具有相似的名称,并且表示大致相同的信息,但属性并不相同。一个是“http://dbpedia.org/property/isbn ”,另一个是“http://dbpedia.org/ontology/isbn ”。
来自 DBpedia wiki 的第 4.3 节 Infobox Data说,http://dbpedia.org/property/
命名空间中的属性包含原始信息框数据,并在较旧的Infobox Dataset中使用:
提取的信息使用命名空间中的属性表示
http://dbpedia.org/property/
。这些属性的名称直接反映了 Wikipedia infobox 属性的名称。属性名称不会被清理或合并。属性类型不是包含层次结构的一部分,并且信息框数据集没有一致的本体。
它还说较新的Infobox Ontology使用http://dbpedia.org/ontology/
命名空间中的属性:
属性使用遵循
http://dbpedia.org/ontology/{propertyname}
命名模式的属性表示。
虽然Infobox Ontology包含的信息不如Infobox Dataset多,但信息更清晰:
因此,信息框本体中的实例数据比信息框数据集更清晰、结构更好,但目前并未涵盖维基百科中的所有信息框类型和信息框属性。
但是,在这种情况下,使用 ontology 属性的三元组似乎比使用 dataset 属性的三元组多,因此您应该使用http://dbpedia.org/ontology/isbn
而不是http://dbpedia.org/property/isbn
.