1

我有这个 XML 文件:

<root>
    <node1>
        <name>A</name>
        <node2>
            <name>B</name>
            <node3>
                <name>C</name>
                <number>001</number>
            </node3>
        </node2>
    </node1>
</root>

我正在解析文件,以获取每个节点的名称以及相应的编号(如果存在)。

我用:

String number = eElement.getElementsByTagName("number").item(0).getTextContent();

这应该给我类似的东西:

Name | Number
A    | 
B    |
C    | 001

但我得到:

Name | Number
A    | 001
B    | 001
C    | 001

所以,我认为getElementsByTagName("Number")正在寻找节点的所有子节点中的数字节点。我不想要那个。有人知道解决方法吗?

我想过使用 XPath 代替上述方法,但我真的很想知道是否有现有的方法。谢谢

4

3 回答 3

2

您可以使用javax.xml.xpathJDK/JRE 中的 API 对返回的 XML 进行更多控制getElementsByTagName

import java.io.File;
import javax.xml.parsers.*;
import javax.xml.xpath.*;
import org.w3c.dom.*;

public class Demo {

    public static void main(String[] args) throws Exception {
        DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
        DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
        Document document = docBuilder.parse(new File("filename.xml"));

        XPathFactory xpathFactory = XPathFactory.newInstance();
        XPath xpath = xpathFactory.newXPath();
        Element element = (Element) xpath.evaluate("//node3/name", document, XPathConstants.NODE);
    }

}
于 2013-11-12T16:05:53.903 回答
1

希望这可以帮助,

import java.io.File;
import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;


public class XML {

public static void main(String[] args) throws IOException {
    File input = new File("D:\\sample.xml");
    Document doc = Jsoup.parse(input, "UTF-8");
    Elements allElements = doc.select("root");
    for(Element value : allElements){
        System.out.println(value.text());
    }
    String node3Num = doc.select("node3").tagName("number").text();

        System.out.println(node3Num);
}

}

输出:ABC 001 C 001

我用过 jsoup-1.7.2 jar(可以从 jsoup.org 下载)

于 2013-11-12T15:16:43.693 回答
0

假设您的eElement变量始终是有问题的<node1/>, <node2/>, ... 元素之一,那么当您替换上面提到的自己的代码段时,以下代码应该可以工作:

String number = null;
NodeList childNodes = eElement.getChildNodes();
for (int i = 0; i < childNodes.getLength(); i++) {
  Node node = childNodes.item(i);
  if (node.getNodeType() == Node.ELEMENT_NODE
      && node.getNodeName().equals("number")) {
    number = node.getTextContent();
    break;
  }
}

number变量将是null没有<number/>孩子的时候;它将包含您需要的数字。

于 2013-11-12T15:27:35.793 回答