0

我有以下 XML 实例:

<entities>
    <person>
        James
    </person>
    <legalEntity legalName="ACME">
    </legalEntity>
    <criminalOrganization>
        <organizationName>Mafia</organizationName>
    </criminalOrganization>
</entities>

并希望打印出每个实体的类型名称

type只是元素名称(personlegalEntitycriminalOrganization名称根据实体的类型定义不同。

所以我有以下代码:

XPathExpression expr = xpath.compile("/entities/(person|legalEntity|criminalOrganization)");
NodeList nodes = (NodeList) expr.evaluate(doc, XPathConstants.NODESET);
for (int i = 0 ; i < nodes.getLength() ; i++) {
    Node node = nodes.item(i);
    String nodeName = node.getNodeName();
    XPathExpression exprInner = xpath.compile("text()|@legalName|organizationName/text()");
    String name = (String) exprInner.evaluate(node);
    System.out.printf("node type = %s, name = %s\n", nodeName, name);
}

代码产生输出:

 node type = person, name = 
         James

 node type = legalEntity, name = ACME
 node type = criminalOrganization, name =

所以基本上,person实体的名称被提取OK(我只需要修剪它),名称legalEntity也被正确提取,但名称criminalOrganization不是。

经过调查,我发现这是因为 XPathunion结构中的第一个表达式:text()|@legalName|organizationName/text()也计算(我想是一些空字符串值),criminalOrganization所以它作为整个联合表达式的计算值返回(而不是比最后一个组件organizationName/text())。

我的问题是:

  1. 为什么在这种情况下也不会发生这种混淆legalEntity

  2. 如何在unionXPath 表达式中包含元素名称谓词以确保每个组件仅针对预期类型进行评估。即元素text(),元素和元素?person@legalNamelegalEntityorganizationName/text()criminalOrganization

4

1 回答 1

1

在我看来,您的解决方案有点奇怪,但您可以尝试使用self::.

试试这个(未测试):

XPathExpression exprInner 
      = xpath.compile("self::person/text()|
                       self::legalEntity/@legalName|
                       self::criminalOrganization/organizationName/text()");
于 2013-06-26T18:48:21.373 回答