3

我必须解析一个 OAI-PMH XML 文件,如下所示。我想遍历<record>ListRecord 中的所有节点。

<?xml version="1.0" encoding="UTF-8"?>
<OAI-PMH xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd" xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
  <responseDate>2010-12-30T10:46:39.654+08:00</responseDate>
  <request verb="ListRecords" metadataPrefix="oai_dc">http://172.16.1.118/ahd/oai2.do</request>
  <ListRecords>
    <record>
      <header>
        <identifier>9010402101001001</identifier>
      </header>
      <metadata>
        <oai_dc:dc xsi:schemaLocationfiltered="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/">
          <dc:identifier>9010402101001001</dc:identifier>
        </oai_dc:dc>
      </metadata>
    </record>
    <resumptionToken>1509/1509</resumptionToken>
  </ListRecords>
</OAI-PMH>

但是当我使用 XOM 1.2.5 来获取这些节点时,无论我使用什么方法(查询或 getChildElements)它总是返回 0 个节点。

以下是我在 Scala 解释器中使用的代码:

scala> import nu.xom.Builder
import nu.xom.Builder

scala> val builder = new Builder
builder: nu.xom.Builder = nu.xom.Builder@6682d439

scala> val document = builder.build(new java.io.File("/home/brianhsu/qqq.xml"))
document: nu.xom.Document = [nu.xom.Document: OAI-PMH]

scala> document.query("//record").size
res0: Int = 0

scala> document.query("//ListRecords").size
res1: Int = 0

scala> document.getRootElement.getChildElements("ListRecords").size
res2: Int = 0

我不知道为什么我不能在 XML 中获取ListRecords和。record我错过了什么?

4

2 回答 2

3

我发现这是XPath Expression 的副本,没有为 //element 返回任何内容,但 //* 返回一个计数

以下代码有效,我需要将标签名称绑定到命名空间。

scala> val context = new XPathContext("xsi", "http://www.openarchives.org/OAI/2.0/")
context: nu.xom.XPathContext = nu.xom.XPathContext@19a3f495

scala> document.query("//xsi:record", context).size
res6: Int = 1
于 2011-08-15T03:55:15.673 回答
2

我敢打赌这是一个xmlns问题——您是否尝试过使用域参数?尝试:

 document.getRootElement
         .getChildElements("ListRecords", 
                           "http://www.openarchives.org/OAI/2.0/").size

基本上,许多语言,当在 XML 对象上给定一个默认的 ns 时,将需要该命名空间来查找该节点——即使它在输出的 DOM 本身中没有前缀。

(这也可以使用 XPathContext 对象来完成,如 Brian Hsu 所示)

于 2011-08-15T03:55:16.313 回答