0

我正在尝试使用 java 来解析维基百科 xml 页面,例如http://en.wikipedia.org/w/api.php?action=query&prop=revisions&format=xml&rvlimit=10&titles=test

我最感兴趣的是捕捉这里代表的标题

<normalized>
  <n from="test" to="Test" />
</normalized>

我已经有了建立连接的代码,我只是停留在捕获标题测试的获取和设置部分。我发现的所有教程似乎都是针对您计算机上的 xml 文件的,但没有一个显示在线捕获并解析它。

4

3 回答 3

0

您需要使用DocumentBuilderFactory

这是有关如何使用它的快速示例

DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
Document doc = docBuilder.parse(new InputSource(new URL(URL).openStream()));

NodeList nodeList = doc.getElementsByTagName("elementnamehere");

for (int temp = 0; temp < nodeList.getLength(); temp++) {

       Node nNode = nodeList.item(temp);
       Element eElement = (Element) nNode;
       if(eElement.getAttribute("elementnamehere") != null)
       {
           //Do something with it

       }
       else
       {

       }

    } 
于 2013-09-26T17:44:05.480 回答
0

这个有什么问题?

parse(InputStream is)
将给定 InputStream 的内容解析为 XML 文档并返回一个新的 DOM 文档

使用 URLConnection 实例的 getInputStream() 方法并使用它来构建 XML 文件

于 2013-09-26T17:32:48.173 回答
0

我发现的所有教程似乎都是针对您计算机上的 xml 文件的,但没有一个显示在线捕获并解析它。//

在线解析xml文件和本地解析没有区别

于 2013-09-26T17:35:38.557 回答