3

看下图:

:Foo :p _:b0 ;
   :p _:b1 ;
   :p _:b2 .

_:b0 :p1 :apple ;
   :p2 :banana .

_:b1 :p3 :cantaloupe ;
   :p4 :date ;
   :p5 :elderberry .

_:b2 :p6 :fig .

注意: :Foo是具有相同谓词的三个三元组的主语,:p。这些三元组中的每一个都有一个空白节点作为其对象。


是否可以编写一个 SPARQL 查询来选择只有_:b1主题的所有三元组?


编辑:在提出答案之前,请理解我正在为我的问题寻找一个聪明的解决方案,在 SPARQL 中。假设三重存储是固定的(即:无法更改数据)。我上面显示的图表是人为的;每个空白节点没有相同数量的 p/o 三元组。但是,如果他们每个人都有一个三元组,那么以下 SPARQL 查询可能就足够了:

select ?b1 where {
   :Foo :p ?bn .
   ?bn ?p ?o
} limit 1 offset 1

显然,这里的关注点是每次都返回相同的空白节点。我知道它是一个集合并且本质上是无序的,因此不能保证可重复的结果排序;但老实说......对于一个固定的三重存储,我真诚地怀疑 DFA 会在查询之间返回不同的空白节点排序。有什么聪明的主意吗?

4

1 回答 1

5

您无法在 SPARQL 中选择“第 n 个”空白节点,原因有两个:

  1. RDF 模型是一个集合:三元组是无序的。
  2. 空白节点表示没有标识符的资源- 这意味着它不能(直接)寻址/识别。

在 RDF/SPARQL 中,您以间接方式使用空白节点:与其尝试直接处理它们(正如我们在上面看到的那样,这是不可能的,因为空白节点的定义是它没有标识符),您查看将它们与其他资源联系起来的事物,即它们所涉及的语句。毕竟,这些语句赋予了空白节点其上下文意义。

在您的情况下:与其他两个空白节点之间的区别在于_:b1它们扮演主题角色的陈述。因此,要在 SPARQL 中查询_:b1主题所在的三元组,您应该查看数据并看到它_:b1唯一具有:p3value的属性:cantaloupe。所以你可以这样查询:

   CONSTRUCT { ?s ?p ?o }
   WHERE { :Foo :p ?s .
           ?s :p3 :cantaloupe ;
              ?p ?o .
   }

附带说明:几个 SPARQL 引擎实现提供了一些功能来解决没有(全局)标识符的空白节点的问题。在许多情况下,它们引入了一些非标准语法扩展或自定义函数,允许您直接寻址 SPARQL 查询中的空白节点。我想强调这是非标准的,不太可能跨不同的端点工作,因此最好避免。

如果您发现如果不以某种方式直接处理空白节点就无法工作,那么您应该考虑在数据中根本不使用空白节点,而是为这些东西创建适当的 IRI。

更新您对问题的更新基本上是这样问的:“我可以在 SPARQL 的未命名特定实现中使用一些未记录的功能来执行查询,严格来说,这是不合法的,或者不能保证给出我想要的结果,然后逃之夭夭?” 这个问题的答案是:可能是的,但这取决于您使用的是哪个 SPARQL 实现,这是一个非常糟糕的主意,出于我在上面给您的所有原因。

在实践中,许多(大多数?)三元存储确实会在查询之间以相同的顺序返回相同的结果,尽管不能保证(我不能强调这一点),你真的不应该依赖它。当然,您可以通过在查询中使用ORDER BY子句来获得有序的查询结果,但这在这种情况下无济于事,因为在 SPARQL 中未定义空白节点的相对顺序(因此查询引擎可以自由返回_:b1并且_:b2在任何命令它认为合适,即使有一个ORDER BY子句)。更糟糕的是:虽然您的输入 RDF 文件可能包含空白节点标识符_:b1_:b2,这不一定是 SPARQL 查询返回的结果。许多三元存储用内部生成的 id 替换空白节点标识符,并且您的 SPARQL 查询很可能会返回_:genid-908c909aeacc4b6da3d3059e18706d68-b1而不是简单地返回_:b1.

即使你能以某种方式可靠地取回空白节点 ID:你打算用它做什么?空白节点为空白。它携带的 id 仅用于内部簿记目的 - 您不能使用空白节点进一步查询任何内容。

相信我:这是个坏主意。如果您无法更改数据,请依靠连接空白节点的属性并查询这些数据。

于 2015-09-30T01:18:01.757 回答