我有以下 XML 实例:
<entities>
<person>
James
</person>
<legalEntity legalName="ACME">
</legalEntity>
<criminalOrganization>
<organizationName>Mafia</organizationName>
</criminalOrganization>
</entities>
并希望打印出每个实体的类型和名称。
type只是元素名称(person
或legalEntity
)criminalOrganization
,
名称根据实体的类型定义不同。
所以我有以下代码:
XPathExpression expr = xpath.compile("/entities/(person|legalEntity|criminalOrganization)");
NodeList nodes = (NodeList) expr.evaluate(doc, XPathConstants.NODESET);
for (int i = 0 ; i < nodes.getLength() ; i++) {
Node node = nodes.item(i);
String nodeName = node.getNodeName();
XPathExpression exprInner = xpath.compile("text()|@legalName|organizationName/text()");
String name = (String) exprInner.evaluate(node);
System.out.printf("node type = %s, name = %s\n", nodeName, name);
}
代码产生输出:
node type = person, name =
James
node type = legalEntity, name = ACME
node type = criminalOrganization, name =
所以基本上,person
实体的名称被提取OK(我只需要修剪它),名称legalEntity
也被正确提取,但名称criminalOrganization
不是。
经过调查,我发现这是因为 XPathunion
结构中的第一个表达式:text()|@legalName|organizationName/text()
也计算(我想是一些空字符串值),criminalOrganization
所以它作为整个联合表达式的计算值返回(而不是比最后一个组件organizationName/text()
)。
我的问题是:
为什么在这种情况下也不会发生这种混淆
legalEntity
?如何在
union
XPath 表达式中包含元素名称谓词以确保每个组件仅针对预期类型进行评估。即元素text()
,元素和元素?person
@legalName
legalEntity
organizationName/text()
criminalOrganization