0

我有这个脚本,它是一个更大的脚本的一部分。我有树不同的 XML 文件,看起来彼此之间有点不同,我需要某种类型的控制结构来更好地处理 nil-object 和 xpath 表达式

我现在拥有的脚本输出 nil 对象:

require 'open-uri'
require 'rexml/document'
include REXML

@urls = Array.new()
@urls << "http://testnavet.skolverket.se/SusaNavExport/EmilObjectExporter?id=186956355&amp;strId=info.uh.kau.KTADY1&amp;EMILVersion=1.1"
@urls << "http://testnavet.skolverket.se/SusaNavExport/EmilObjectExporter?id=184594606&amp;strId=info.uh.gu.GS5&amp;EMILVersion=1.1"
@urls << "http://testnavet.skolverket.se/SusaNavExport/EmilObjectExporter?id=185978100&amp;strId=info.uh.su.ARO720&amp;EMILVersion=1.1"

@urls.each do |url|
  doc = REXML::Document.new(open(url).read)
  doc.elements.each("/educationInfo/extensionInfo/nya:textualDescription/nya:textualDescriptionPhrase | /ns:educationInfo/ns:extensionInfo/gu:guInfoExtensions/gu:guSubject/gu:descriptions/gu:description | //*[name()='ct:text']"){
      |e| m = e.text 
      m.gsub!(/<.+?>/, "")
      puts "Description: " + m 
      puts ""   
    }
end

输出:

描述:bestrykning,kalandrering,tryckning,kemiteknik

描述:Vill du jobba med internationella och globala frågor med... 描述:全球化研究对于我们了解当今世界变得越来越重要,全球研究学院是一个独特的研究环境。

描述:

描述:

描述: Kursen behandlar identifieringen och beskrivningen av sjukliga förändringar i mänskliga skelett。Kursen ger en ämneshistorisk bakgrund och skelettförändringars förhållanden till moderna kliniska data diskuteras。

4

1 回答 1

1

请参阅这篇文章,了解如何在 ruby​​ 中使用块时跳过条目。doc.elements 上的方法 each() 被一个块调用(这是您包含 gsub 和 puts 调用的代码)。“next”关键字将让您停止执行当前元素的块并继续执行下一个元素。


doc.elements.each("/educationInfo/extensionInfo/nya:textualDescription/nya:textualDescriptionPhrase | /ns:educationInfo/ns:extensionInfo/gu:guInfoExtensions/gu:guSubject/gu:descriptions/gu:description | //*[name()='ct:text']"){
      |e| m = e.text 
      m.gsub!(//, "")

      next if m.empty?

      puts "Description: " + m 
      puts ""   
    }

当使用“next”关键字时,我们知道“m”是一个字符串(而不是 nil),因为我们刚刚调用了 gsub!在它上面,执行该行时没有抛出错误。这意味着空白描述是由空字符串引起的,而不是 nil 对象。

于 2012-03-03T22:45:25.077 回答