我试图从通过 SOAP Web 服务调用返回的一些 XML 中提取一个 html 字符串。我的 Node 对象属于以下类:
org.w3c.dom.Node
这是我用来遍历节点的循环的代码示例:
for(int t = 0; t < elements; t++)
{
Element myElement = (Element)elements.item(t);
NodeList childNodes = myElement.getChildNodes();
int numChildren = childNodes.getLength();
for(int counter = 0; counter < numChildren; counter++)
{
Node currentNode = childNodes.item(counter);
NodeList currentNodeChildNodes = currentNode.getChildNodes();
int numCurrentNodeChildren = currentNodeChildNodes.getLength();
Node firstChild = currentNodeChildNodes.item( 0 );
}
}
现在,其中一些节点包含原始 html。这当然让他们看起来像有孩子。我想获取这些 html 节点并将其所有内容直接放入String
. 我试过currentNode.getTextContent()
了,它只会产生一个java.lang.NullPointerException
.
有没有一种方法可以用来获取节点并将其原始内容作为字符串获取,无论它是否包含子节点?
编辑:这是带有 html 内容的 XML 示例
<?xml version="1.0" encoding="utf-16"?>
<soap:Envelope xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/">
<soap:Body>
<GetInfoResponse xmlns="http://www.mycompany.com/">
<GetInfoResult>
<infoList>
<Info>
<iso>US</iso>
<country_name>United States</country_name>
<title>This is the title</title>
<html_string><strong>NEWS</strong><h1>This is a section header</h1><p>Here is some information</p></html_string>
<last_update_date>2013-01-01 00:00:00</last_update_date>
</Info>
</infoList>
<faultResponse>
<faultOccurred>boolean</faultOccurred>
<faultDescription>string</faultDescription>
</faultResponse>
</GetInfoResult>
</GetInfoResponse>
</soap:Body>
</soap:Envelope>