4

我有一个 OWL 文件,其中包含一个分类层次结构,我想编写一个查询,其中答案包括每个个体及其直接的分类父级。这是一个示例(完整的查询相当混乱)。

@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix rdf: <http:://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix : <urn:ex:> .

:fido rdf:type :Dog .
:Dog rdfs:subClassOf :Mammal .
:Mammal rdfs:subClassOf :Vertebrate .
:Vertebrate rdfs:subClassOf :Animal .
:fido :hasToy :bone

:kitty rdf:type :Cat .
:Cat rdfs:subClassOf :Mammal .
:kitty :hasToy :catnipMouse .

这个查询做了我想要的。

prefix rdf: <http:://www.w3.org/1999/02/22-rdf-syntax-ns#> .
prefix : <urn:ex:> .

SELECT ?individual ?type 
WHERE {
   ?individual :hasToy :bone .
   ?individual rdf:type ?type .
}

问题是我宁愿使用 OWL 文件的推理版本,不出所料,其中包含附加语句:

:fido rdf:type :Mammal .
:fido rdf:type :Vertebrate .
:fido rdf:type :Animal .
:kitty rdf:type :Mammal .
:kitty rdf:type :Vertebrate .
:kitty rdf:type :Animal .

现在查询导致关于 Fido 是哺乳动物等的附加答案。我可以放弃使用文件的合理版本,或者,由于 SPARQL 查询是从 java 调用的,我可以做一堆额外的查询找到出现的包含最少的类型。我的问题是是否有一个合理的纯 SPARQL 解决方案只返回 Dog 解决方案。

4

1 回答 1

3

一个通用的解决方案是确保只要求直接类型。类C是实例的直接类型,X如果:

  1. X是类型C
  2. 没有C'这样的:
    • X是类型C'
    • C'是一个子类C
    • C'不等于C

(顺便说一下,最后一个条件是必要的,因为在 RDF/OWL 中,子类关系是自反的:每个类都是它自己的子类)

在 SPARQL 中,这变成了这样:

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX : <urn:ex:> .

SELECT ?individual ?type 
WHERE {
   ?individual :hasToy :bone .
   ?individual a ?type .
   FILTER NOT EXISTS { ?individual a ?other .
                       ?other rdfs:subClassOf ?type .
                       FILTER(?other != ?type)
   }
}

根据您用于执行这些查询的 API/triplestore/库,可能还有其他特定于工具的解决方案。例如,Sesame API(披露:我在 Sesame 开发团队中)可以选择禁用推理以实现单个查询:

TupleQuery query = conn.prepareTupleQuery(SPARQL, "SELECT ...");
query.setIncludeInferred(false); 

TupleQueryResult result = query.evaluate();

Sesame 还提供了一个可选的附加推理器(称为“直接类型推理器”),它引入了您可以查询的附加“虚拟”属性,例如sesame:directTypesesame:directSubClassOf等。其他工具无疑也有类似的选项。

于 2015-10-04T19:52:05.030 回答