1

我需要一些帮助来提出正确的 XPath 表达式以从 XML 中提取值。

我可以使用 jaxb 获取值,但是我需要 xpath,因为我有一种决策表类型的映射规则,我想将其外部化,如果我使用 jaxb 会导致很多我想避免的嵌套 if/else 语句,因此需要 xpath 方法。

我有一个至少由 4 个模式构成的 xml 文件。我的意思是根模式在特定点有一个元素,它说 xs:any 并且在这个位置注入了一个基于不同模式的 xml,这反过来又具有类似的 xs:any 注入另一个 xml 以构建最终/我使用的实际 xml。

这是我正在处理的实际 XML 结构(我有意修改了这些值)。下面 xml 中的两个 Document 节点基于不同的模式

<?xml version="1.0"?>
<env:Envelope xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:env="CDTS-SUBMIT">
  <env:Body>
    <cdtPrefix>
      <cdtprVersion>01</cdtprVersion>
      <cdtprOperation>SUBMIT</cdtprOperation>
      <cdtprFunction>GCAMS1O</cdtprFunction>
      <cdtprDirectionFlag>O</cdtprDirectionFlag>
    </cdtPrefix>
    <cdtDataDescription>
      <cdtddVersion>01</cdtddVersion>
      <cdtddFirmId>ABC</cdtddFirmId>
      <cdtddBusinessDataFormat>GCAMS1O-XML</cdtddBusinessDataFormat>
      <cdtddReferenceNum>123</cdtddReferenceNum>
      <cdtddTrackingNum>123</cdtddTrackingNum>
      <cdtddDestination>AQ</cdtddDestination>
      <cdtddSeqNum>0000000</cdtddSeqNum>
      <cdtddCycleNum>00</cdtddCycleNum>
      <cdtddBusinessDate>00000000</cdtddBusinessDate>
    </cdtDataDescription>
    <cdtBusinessData>
      <AppHdr xmlns="urn:iso:std:iso:20022:tech:xsd:head.001.001.01" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
        <Fr>
          <FIId>
            <FinInstnId>
              <BICFI>ABC</BICFI>
            </FinInstnId>
          </FIId>
        </Fr>
        <To>
          <FIId>
            <FinInstnId>
              <BICFI>ABC   </BICFI>
            </FinInstnId>
          </FIId>
        </To>
        <BizMsgIdr>ABC</BizMsgIdr>
        <MsgDefIdr>seev.031.002.05</MsgDefIdr>
        <BizSvc>CSD</BizSvc>
        <CreDt>9999-99-99T00:02:17Z</CreDt>
      </AppHdr>
      <Document xmlns="urn:swift:xsd:seev.031.002.05" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
        <CorpActnNtfctn>
          <NtfctnGnlInf>
            <NtfctnTp>REPL</NtfctnTp>
            <PrcgSts>
              <Cd>
                <EvtCmpltnsSts>COMP</EvtCmpltnsSts>
                <EvtConfSts>CONF</EvtConfSts>
              </Cd>
            </PrcgSts>
          </NtfctnGnlInf>
          <PrvsNtfctnId>
            <Id>00000000</Id>
          </PrvsNtfctnId>
          <EvtsLkg>
            <EvtId>
              <LkdOffclCorpActnEvtId>US8</LkdOffclCorpActnEvtId>
            </EvtId>
            <LkgTp>
              <Cd>INFO</Cd>
            </LkgTp>
          </EvtsLkg>
          <CorpActnGnlInf>
            <CorpActnEvtId>000</CorpActnEvtId>
            <OffclCorpActnEvtId>US7</OffclCorpActnEvtId>
            <EvtPrcgTp>
              <Cd>DISN</Cd>
            </EvtPrcgTp>
            <EvtTp>
              <Cd>INTR</Cd>
            </EvtTp>
            <MndtryVlntryEvtTp>
              <Cd>CHOS</Cd>
            </MndtryVlntryEvtTp>
            <UndrlygScty>
              <FinInstrmId>
                <OthrId>
                  <Id>J54675AA1</Id>
                  <Tp>
                    <Cd>CUSP</Cd>
                  </Tp>
                </OthrId>
                <Desc>JASDFKASDFADSFAFADSF</Desc>
              </FinInstrmId>
              <ClssfctnTp>
                <ClssfctnFinInstrm>DBXXXX</ClssfctnFinInstrm>
              </ClssfctnTp>
            </UndrlygScty>
          </CorpActnGnlInf>
          <AcctDtls>
            <ForAllAccts>
              <IdCd>GENR</IdCd>
            </ForAllAccts>
          </AcctDtls>
          <CorpActnDtls>
            <DtDtls>
              <RcrdDt>
                <Dt>
                  <Dt>0000-04-03</Dt>
                </Dt>
              </RcrdDt>
            </DtDtls>
            <RateAndAmtDtls>
              <Intrst>
                <Rate>0</Rate>
              </Intrst>
            </RateAndAmtDtls>
            <IntrstAcrdNbOfDays>0</IntrstAcrdNbOfDays>
          </CorpActnDtls>
          <CorpActnOptnDtls>
            <OptnNb>001</OptnNb>
            <OptnTp>
              <Cd>CASH</Cd>
            </OptnTp>
            <DfltPrcgOrStgInstr>
              <DfltOptnInd>true</DfltOptnInd>
            </DfltPrcgOrStgInstr>
            <DtDtls>
              <RspnDdln>
                <Dt>
                  <DtTm>0000-04-10T20:00:00-04:00</DtTm>
                </Dt>
              </RspnDdln>
            </DtDtls>
            <PrdDtls>
              <ActnPrd>
                <Prd>
                  <StartDt>
                    <Dt>
                      <DtTm>0000-04-06T00:00:00-04:00</DtTm>
                    </Dt>
                  </StartDt>
                  <EndDt>
                    <NotSpcfdDt>UKWN</NotSpcfdDt>
                  </EndDt>
                </Prd>
              </ActnPrd>
            </PrdDtls>
            <CshMvmntDtls>
              <CdtDbtInd>CRDT</CdtDbtInd>
              <IncmTp>
                <Id>0004</Id>
                <Issr>IRSX</Issr>
              </IncmTp>
              <DtDtls>
                <PmtDt>
                  <Dt>
                    <Dt>0000-04-18</Dt>
                  </Dt>
                </PmtDt>
              </DtDtls>
              <RateAndAmtDtls>
                <IntrstRateUsdForPmt>
                  <RateTpAndAmtAndRateSts>
                    <RateTp>
                      <Cd>SCHD</Cd>
                    </RateTp>
                    <Amt Ccy="USD">21.17125</Amt>
                  </RateTpAndAmtAndRateSts>
                </IntrstRateUsdForPmt>
                <WhldgOfLclTax>
                  <Rate>15.315</Rate>
                </WhldgOfLclTax>
              </RateAndAmtDtls>
            </CshMvmntDtls>
          </CorpActnOptnDtls>
          <CorpActnOptnDtls>
            <OptnNb>002</OptnNb>
            <OptnTp>
              <Cd>CASH</Cd>
            </OptnTp>
            <OptnFeatrs>
              <Cd>ASVO</Cd>
            </OptnFeatrs>
            <DfltPrcgOrStgInstr>
              <DfltOptnInd>false</DfltOptnInd>
            </DfltPrcgOrStgInstr>
            <DtDtls>
              <RspnDdln>
                <Dt>
                  <DtTm>0000-04-10T20:00:00-04:00</DtTm>
                </Dt>
              </RspnDdln>
            </DtDtls>
            <PrdDtls>
              <ActnPrd>
                <Prd>
                  <StartDt>
                    <Dt>
                      <DtTm>0000-04-06T00:00:00-04:00</DtTm>
                    </Dt>
                  </StartDt>
                  <EndDt>
                    <NotSpcfdDt>UKWN</NotSpcfdDt>
                  </EndDt>
                </Prd>
              </ActnPrd>
            </PrdDtls>
            <CshMvmntDtls>
              <CdtDbtInd>CRDT</CdtDbtInd>
              <IncmTp>
                <Id>0004</Id>
                <Issr>IRSX</Issr>
              </IncmTp>
              <DtDtls>
                <PmtDt>
                  <Dt>
                    <Dt>0000-04-18</Dt>
                  </Dt>
                </PmtDt>
              </DtDtls>
              <RateAndAmtDtls>
                <IntrstRateUsdForPmt>
                  <RateTpAndAmtAndRateSts>
                    <RateTp>
                      <Cd>SCHD</Cd>
                    </RateTp>
                    <Amt Ccy="USD">25</Amt>
                  </RateTpAndAmtAndRateSts>
                </IntrstRateUsdForPmt>
                <WhldgOfLclTax>
                  <Rate>0</Rate>
                </WhldgOfLclTax>
              </RateAndAmtDtls>
            </CshMvmntDtls>
          </CorpActnOptnDtls>
          <AddtlInf>
            <AddtlTxt>
              <UpdDt>0000-04-04</UpdDt>
              <AddtlInf> adfafadfasdfasdfasdfsdafadfdsafdf</AddtlInf>
            </AddtlTxt>
          </AddtlInf>
          <Regar>
            <NmAndAdr>
              <Nm>Not Available</Nm>
            </NmAndAdr>
          </Regar>
          <SplmtryData>
            <Envlp>
              <Document xmlns="urn:swift:xsd:supl.001.001.05" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
                <DTCCCANOCSDDataSD1>
                  <NtfctnGnlInf>
                    <PlcAndNm>/Document/CorpActnNtfctn/NtfctnGnlInf</PlcAndNm>
                    <CretDtAndTm>0000-04-24T11:34:09</CretDtAndTm>
                    <UpdDtAndTm>0000-04-24T20:02:16</UpdDtAndTm>
                  </NtfctnGnlInf>
                  <CorpActnGnlInf>
                    <PlcAndNm>/Document/CorpActnNtfctn/CorpActnGnlInf</PlcAndNm>
                    <EDSMsggElgbltyFlg>true</EDSMsggElgbltyFlg>
                    <DTCFCPElctnFlg>false</DTCFCPElctnFlg>
                    <AsstSvcrPrcgFlg>true</AsstSvcrPrcgFlg>
                  </CorpActnGnlInf>
                  <UndrlygScty>
                    <PlcAndNm>/Document/CorpActnNtfctn/CorpActnGnlInf/UndrlygScty</PlcAndNm>
                    <CtryOfListg>DE</CtryOfListg>
                    <IncmSrcCtry>JP</IncmSrcCtry>
                    <DTCAsstClss>CRPB</DTCAsstClss>
                    <DTCAsstTp>S500</DTCAsstTp>
                  </UndrlygScty>
                  <CorpActnDtls>
                    <PlcAndNm>/Document/CorpActnNtfctn/CorpActnDtls</PlcAndNm>
                    <CutOffDays>0</CutOffDays>
                    <EDSMsggCtryCd>JP</EDSMsggCtryCd>
                    <RDPRefNb>yyyyyyJ54675xxxxxxxxxxxxxxxxxxxx</RDPRefNb>
                  </CorpActnDtls>
                  <CorpActnDtDtls>
                    <PlcAndNm>/Document/CorpActnNtfctn/CorpActnDtls/DtDtls</PlcAndNm>
                    <DTCPosCaptrDt>0000-04-03</DTCPosCaptrDt>
                  </CorpActnDtDtls>
                  <OptnDtls>
                    <PlcAndNm>/Document/CorpActnNtfctn/CorpActnOptnDtls[1]</PlcAndNm>
                    <XtndedOptnFeatrs>FORU</XtndedOptnFeatrs>
                    <DfltOptnFlg>true</DfltOptnFlg>
                    <RDPRefNb>yyyyyyJ54675xxxxxxxxxxxxxxxxxxxx</RDPRefNb>
                  </OptnDtls>
                  <OptnDtls>
                    <PlcAndNm>/Document/CorpActnNtfctn/CorpActnOptnDtls[2]</PlcAndNm>
                    <XtndedOptnFeatrs>FORX</XtndedOptnFeatrs>
                    <RDPRefNb>yyyyyyJ54675xxxxxxxxxxxxxxxxxxxx</RDPRefNb>
                  </OptnDtls>
                  <CshMvmntDtls>
                    <PlcAndNm>/Document/CorpActnNtfctn/CorpActnOptnDtls[1]/CshMvmntDtls[1]</PlcAndNm>
                    <DTCPayMtd>1</DTCPayMtd>
                    <DTCPayOrdr>0</DTCPayOrdr>
                    <NRATaxRptblFlg>false</NRATaxRptblFlg>
                    <DclrdGrssRate>
                      <AmtPricPerFinInstrmQty>
                        <AmtPricTp>ACTU</AmtPricTp>
                        <PricVal Ccy="USD">25</PricVal>
                        <FinInstrmQty>
                          <FaceAmt>1000</FaceAmt>
                        </FinInstrmQty>
                      </AmtPricPerFinInstrmQty>
                    </DclrdGrssRate>
                    <RDPRefNb>yyyyyyJ54675xxxxxxxxxxxxxxxxxxxx</RDPRefNb>
                  </CshMvmntDtls>
                  <CshMvmntDtls>
                    <PlcAndNm>/Document/CorpActnNtfctn/CorpActnOptnDtls[2]/CshMvmntDtls[1]</PlcAndNm>
                    <DTCPayMtd>1</DTCPayMtd>
                    <DTCPayOrdr>0</DTCPayOrdr>
                    <NRATaxRptblFlg>false</NRATaxRptblFlg>
                    <RDPRefNb>yyyyyyJ54675xxxxxxxxxxxxxxxxxxxx</RDPRefNb>
                  </CshMvmntDtls>
                  <Agt>
                    <PlcAndNm>/Document/CorpActnNtfctn/Regar/NmAndAdr</PlcAndNm>
                    <AgtId>00009910</AgtId>
                  </Agt>
                </DTCCCANOCSDDataSD1>
              </Document>
            </Envlp>
          </SplmtryData>
        </CorpActnNtfctn>
      </Document>
    </cdtBusinessData>
  </env:Body>
</env:Envelope>

我可以毫无问题地提取前几个元素,例如 /env:Envelope/env:Body/cdtBusinessData

cdtBusinessData 是主架构中采用 xs:any 的元素 。架构片段如下

                <xs:element name="cdtBusinessData" form="unqualified">
                    <xs:complexType>
                        <xs:sequence>
                            <xs:any minOccurs="0"/>
                        </xs:sequence>
                    </xs:complexType>
                </xs:element>

正是从这一点开始,我的 xpath 查询并没有按照我期望的方式工作。

,当我尝试 /env:Envelope/env:Body/cdtBusinessData/Document 时,它不会将其识别为 jxpath 上的正确路径。在为选定节点提供 xpath(如 xpather/firepath/XpathBuilder)的不同工具上,我得到不同的值,xpath 都不接受这些值。

您能否帮助我了解如何从上述 xml 中的两个嵌入式节点中提取值。

我已经为此苦苦挣扎了一段时间,终于在这里寻求帮助。如果您能帮助我更正此路径,将不胜感激 //env:Envelope/env:Body/cdtBusinessData/ Document


更新

这是我根据您的建议提出的。我使用的是 jxpath 1.3。我在这里做错了什么?我在 sysouts 旁边有内嵌评论,以表明我得到了什么

package com.testbed;

import java.io.ByteArrayInputStream;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.apache.commons.jxpath.JXPathContext;

import com.xyz.ib.pb.dtcc.util.FileUtils;

public class TestJXPathApproach {

    public static void main(String a[]) throws Exception {              
        String xmlMsg = FileUtils.readFileContents("C:\\dtcc-stuff\\SR\\1.xml");
        //xmlMsg = StringUtils.remove(xmlMsg, "<?xml version=\"1.0\"?>");
        TestJXPathApproach myTest = new TestJXPathApproach();
        myTest.testJxPathExpressions(xmlMsg);
    }

    private void testJxPathExpressions(String xmlMsg) {
        org.w3c.dom.Document doc = null;
        try {
            DocumentBuilder builder = DocumentBuilderFactory.newInstance().newDocumentBuilder();
            ByteArrayInputStream bais = new ByteArrayInputStream(xmlMsg.getBytes("UTF8"));
            doc = builder.parse(bais);
            bais.close();
            JXPathContext context = JXPathContext.newContext(doc);
            context.setLenient(true);
            context.registerNamespace("d", "urn:swift:xsd:seev.031.002.05");
            context.registerNamespace("dd", "urn:swift:xsd:supl.001.001.05");


            String cdtddTrackingNumVal = (String)context.getValue("/env:Envelope/env:Body/cdtDataDescription/cdtddTrackingNum");
            System.out.println("cdtddTrackingNumVal : "+cdtddTrackingNumVal); // prints the value correctly


            String cdVal = (String)context.getValue("/env:Envelope/env:Body/cdtBusinessData/d:Document/CorpActnNtfctn/CorpActnGnlInf/EvtTp/Cd");
            System.out.println("cdVal : "+cdVal);// prints null with namespace mappping specified

            cdVal = (String)context.getValue("/env:Envelope/env:Body/cdtBusinessData/Document/CorpActnNtfctn/CorpActnGnlInf/EvtTp/Cd");
            System.out.println("cdVal : "+cdVal);// prints null with no namespace mapping 

            cdVal = (String)context.getValue("/env:Envelope/env:Body/cdtBusinessData/*:Document/CorpActnNtfctn/CorpActnGnlInf/EvtTp/Cd");
            System.out.println("cdVal : "+cdVal);// prints null with wildcard namespace mapping 

            Object nodeObj  = context.selectSingleNode("/env:Envelope/env:Body/cdtBusinessData/d:Document/CorpActnNtfctn");
            System.out.println("nodeObj : "+nodeObj);// prints null


        }catch(Exception e) {
            e.printStackTrace();
        }
    }

}
4

2 回答 2

6

如果您希望能够选择其中一个,请为 Document使用命名空间通配符:

/env:Envelope/env:Body/cdtBusinessData/*:Document

...或者,在一个查询中获取两个文档:

//*:Document

查看完整的 XQuery 文档,您可以在https://gist.github.com/charles-dyfis-net/983d4054f4f9424a1698上运行该文档以查看其工作情况


以上与 XPath 1.0 兼容的版本(非常感谢@kjhughes):

/env:Envelope/env:Body/cdtBusinessData/*[local-name()='Document']

...或者...

//*[local-name() = 'Document']
于 2015-07-10T17:07:41.253 回答
2

如果您在 JXPath 中注册了以下命名空间前缀,

JXPathContext.registerNamespace("sw", "urn:swift:xsd:seev.031.002.05")
JXPathContext.registerNamespace("env", "CDTS-SUBMIT")

然后是以下 XPath,

/env:Envelope/env:Body/cdtBusinessData/sw:Document

将成功选择命名空间Document中的元素urn:swift:xsd:seev.031.002.05

更新

如果要选择Document不同命名空间中的元素,请以类似方式为新命名空间注册一个前缀,并在 XPath 中使用它。

使用已注册的命名空间前缀通常是首选做法,但如果您想忽略命名空间,在XPath 2.0中您可以使用Charles Duffy 展示*:Document的技术。

XPath 1.0中,该*:技术不起作用,但您可以针对元素的本地名称进行测试:

//*[local-name() = 'Document']

将选择所有Document元素,而不考虑名称空间(并且不考虑遗产)。

于 2015-07-10T17:00:38.833 回答