8

我正在尝试使用 Nokogiri、Ruby 和 XPath 解析 XML 文件。我通常不会遇到任何问题,但以下我无法发出任何 xpath 请求:

doc = Nokogiri::HTML(open("myfile.xml"))
doc.("//Meta").count 
# result ==> 0

doc.xpath("//Meta") 
# result ==> []

doc.xpath(.).count
# result => 1

这是我的 XML 文件的简化版本

<Answer xmlns="test:com.test.search" context="hf%3D10%26target%3Dst0" last="0" estimated="false" nmatches="1" nslices="0" nhits="1" start="0">
  <time>
    ...
  </time>
  <promoted>
    ...
  </promoted>
  <hits>
    <Hit url="http://www.test.com/" source="test" collapsed="false" preferred="false" score="1254772" sort="0" mask="272" contentFp="4294967295" did="1287" slice="1">
      <groups>
        ...
      </groups>
      <metas>
        <Meta name="enligne">
          <MetaString name="value">
          </MetaString>
        </Meta>

        <Meta name="language">
          <MetaString name="value">
            fr
          </MetaString>
        </Meta>
        <Meta name="text">
          <MetaText name="value">
            <TextSeg highlighted="false" highlightClass="0">
              La
            </TextSeg>
          </MetaText>
        </Meta>
      </metas>
    </Hit>
  </hits>
  <keywords>
    ...
  </keywords>
  <groups>
    ...
  </groups>

如何<Hit>从此 XML 中获取所有子级?

4

3 回答 3

18

调用时包含命名空间信息xpath

doc.xpath("//x:Meta", "x" => "test:com.test.search")
于 2012-06-22T14:50:51.280 回答
11

您可以使用该remove_namespaces!方法并节省您的一天。

于 2012-11-22T14:29:47.623 回答
1

这是 XPath 最常见的问题之一——搜索“XPath 默认命名空间”。

如果无法为默认命名空间注册命名空间并使用已注册的前缀(例如"x"in //x:Meta),则使用:

//*[name() = 'Meta` and namespace-uri()='test:com.test.search']

如果知道Meta只能属于默认命名空间,那么上面可以简写为:

//*[name() = 'Meta`]
于 2012-06-22T14:30:34.323 回答