2

我在尝试遍历 XML 文件的一部分时遇到问题。我正在使用带有 Rails3 的 Nokogiri。

我正在阅读这个 XML 提要 - http://www.ecb.europa.eu/stats/eurofxref/eurofxref-hist-90d.xml

这是我的代码:

def save_rates

    # get the XML data form ECB URL
    file_handle = open('http://www.ecb.europa.eu/stats/eurofxref/eurofxref-hist-90d.xml')

    # get document xml string and create Nokogiri object
    doc = Nokogiri::XML(file_handle)

    # foreach date...
    doc.xpath("//Cube/Cube").each do |cube|

        raise cube.inspect # isn't being executed

        # foreach currency...
        cube.xpath("./Cube").each do |curr|
            # create DB entry
            Exchange.create(:currency=>curr.currency, :rate=>curr.rate, :record_date => cube.time)

        end
    end

end

当我检查时,doc我可以看到 Nokogiri 对象。但是,当我尝试cube.inspect在第一个 .each 循环中加注时,它并没有触发。所以它让我相信我的道路是错误的://Cube/Cube

从我在 Nokogiri 教程中看到的其他示例中,路径与此类似。我的路径是错的还是我在这里做错了什么?

我是ruby n00b,所以请放轻松!

更新

这是XML的格式

<gesmes:Envelope xmlns:gesmes="http://www.gesmes.org/xml/2002-08-01" xmlns="http://www.ecb.int/vocabulary/2002-08-01/eurofxref">
    <gesmes:subject>Reference rates</gesmes:subject>
    <gesmes:Sender>
    <gesmes:name>European Central Bank</gesmes:name>
    </gesmes:Sender>
    <Cube>
        <Cube time="2013-02-25">
            <Cube currency="USD" rate="1.3304"/>
            <Cube currency="JPY" rate="125"/>
            <Cube currency="BGN" rate="1.9558"/>
            <Cube currency="CZK" rate="25.52"/>
            <Cube currency="DKK" rate="7.4614"/>
            <Cube currency="GBP" rate="0.8789"/>
            ...
        </Cube>
        <Cube>
        <Cube time="2013-02-24">
            <Cube currency="USD" rate="1.3304"/>
            <Cube currency="JPY" rate="125"/>
            <Cube currency="BGN" rate="1.9558"/>
            <Cube currency="CZK" rate="25.52"/>
            <Cube currency="DKK" rate="7.4614"/>
            <Cube currency="GBP" rate="0.8789"/>
            ...
        </Cube>
    </Cube>
</gesmes:Envelope>
4

1 回答 1

4

这里的问题是由于XML 命名空间

在 XML 的根属性中有一个属性xmlns="http://www.ecb.int/vocabulary/2002-08-01/eurofxref",它指定了默认命名空间。Cube元素在这个命名空间中,如果你只使用而不Cube指定命名空间,你将不会得到匹配。

要在 Nokogiri 中指定命名空间,您可以执行以下操作:

doc.xpath("//ecb:Cube/ecb:Cube", 'ecb' => "http://www.ecb.int/vocabulary/2002-08-01/eurofxref")

在这里,我们为命名空间指定了前缀ecb,并在 XPath 表达式中使用了前缀。

在这种情况下,命名空间是根节点上声明的默认命名空间,Nokogiri 会xmlns为我们在前缀上声明它,所以我们可以使用更简单的:

doc.xpath("//xmlns:Cube/xmlns:Cube")

这将导致与第一个相同的结果。

如果您对命名空间不感兴趣,一个更简单的可能性是使用remove_namespaces!方法

doc.remove_namespaces!
doc.xpath("//Cube/Cube")

由于名称空间信息已被删除,因此结果与前两个示例不太一样,但它会为您提供您期望的节点。

于 2013-02-25T15:00:07.260 回答