4

我正在接收 xml 序列化的 RDF(作为 XMP 媒体描述的一部分,以防万一),并在 Ruby 中进行处理。我正在尝试使用rdfgem,尽管很高兴看到其他解决方案。

我已经设法加载和查询最基本的数据,但是在尝试为包含序列和包的项目构建查询时被卡住了。

示例 XML RDF:

<rdf:RDF xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#'>
 <rdf:Description rdf:about='' xmlns:dc='http://purl.org/dc/elements/1.1/'>
  <dc:date>
   <rdf:Seq>
    <rdf:li>2013-04-08</rdf:li>
   </rdf:Seq>
  </dc:date>
 </rdf:Description>
</rdf:RDF>

我将查询放在一起的最佳尝试:

require 'rdf'
require 'rdf/rdfxml'
require 'rdf/vocab/dc11'

graph = RDF::Graph.load( 'test.rdf' )

date_query = RDF::Query.new( :subject => { RDF::DC11.date => :date } )

results = date_query.execute(graph)

results.map { |result| { result.subject.to_s => result.date.inspect  } }

 => [{"test.rdf"=>"#<RDF::Node:0x3fc186b3eef8(_:g70100421177080)>"}]

我的印象是我在这个阶段的结果(“查询解决方案”?)是对rdf:Seq容器的引用。但我不知道如何进步。对于上面的示例,我希望最终得到一个 array ["2013-04-08"]

当有没有rdf:Seq和容器的传入数据时,我可以按照http://rdf.rubyforge.org/RDF/Query.html上的示例rdf:li提取我想要使用的字符串- 不幸的是,我找不到更复杂查询的任何示例或用 Ruby 处理的 RDF 结构。RDF::Query

编辑:此外,当我尝试找到与RDF::Node对象一起使用的适当方法时,我看不到任何方法来探索它可能具有的任何进一步关系:

results[0].date.methods - Object.methods
 => [:original, :original=, :id, :id=, :node?, :anonymous?, :unlabeled?, :labeled?, :to_sym, :resource?, :constant?, :variable?, :between?, :graph?, :literal?, :statement?, :iri?, :uri?, :valid?, :invalid?, :validate!, :validate, :to_rdf, :inspect!, :type_error, :to_ntriples]
# None of the above leads AFAICS to more data in the graph

我知道如何在 xpath 中获取相同的数据(好吧,至少假设我们在序列化中总是获得相同的路径),但觉得它不是在这种情况下使用的最佳查询语言(这是我的备份计划,但是,如果事实证明,实现 RDF 查询解决方案过于复杂)

4

1 回答 1

3

我认为你说“我在这个阶段的结果(“查询解决方案”?)是对 rdf:Seq 容器的引用是正确的。RDF/XML 是一种非常可怕的序列化格式,而是将数据视为图形。这是一张 RDF:Bag 的图片。RDF:Seq 的工作原理相同,示例中的 #students 类似于您的案例中的 #date。RDF:Bag 例子,RDF:Seq 是一样的

因此,要获取日期文字,您需要在图中进一步跳一个节点。我不熟悉这个 Ruby 库的语法,但类似:

require 'rdf'
require 'rdf/rdfxml'
require 'rdf/vocab/dc11'

graph = RDF::Graph.load( 'test.rdf' )

date_query = RDF::Query.new({
  :yourThing => {
    RDF::DC11.date  => :dateSeq
  },
  :dateSeq => {
      RDF.type => RDF.Seq,
      RDF._1 => :dateLiteral
  }
})

date_query.execute(graph).each do |solution|
  puts "date=#{solution.dateLiteral}"
end

当然,如果您希望 Seq 实际上包含多个日期(否则拥有 Seq 就没有意义),您必须将它们与RDF._1 => :dateLiteral1,RDF._2 => :dateLiteral2等匹配RDF._3 => :dateLiteral3

或者对于更通用的解决方案,将 dateSeq 上的所有属性和对象与:

:dateSeq => {
    :property => :dateLiteral
}

然后过滤掉:property最终成为RDF:typewhile:dateLiteral实际上不是日期而是RDF:Seq. 也许图书馆也有一个特殊的方法来获取所有 Seq 的内容。

于 2013-04-13T10:13:54.107 回答