0

我知道这里XSL:如何复制树,但删除一些节点?,但我有一个更复杂的 XML 文件,但效果不是很好。

整个 XML 和 XSLT 对我来说都是新的,我的老板分配给我一个任务,将 XML(来自 VMWare 的 OVF 文件)转换为另一个,并删除一些节点,添加其他节点并更新信息。我有两个 XML 文件,我的任务是设计将转换它们的 XSLT。

这是原始的 XML:

<?xml version="1.0" encoding="UTF-8"?>
<!-- Built using IBM Image Construction and Composition Tool, version: 1.2.0.1-20121129-1310-255 on: Oct 18, 2013 12:14:22 -->
<Envelope
    xmlns="http://schemas.dmtf.org/ovf/envelope/1" xmlns:ovf="http://schemas.dmtf.org/ovf/envelope/1"
    xmlns:cloudburst="http://www.ibm.com/websphere/rainmaker/2009/3" xmlns:rasd="http://schemas.dmtf.org/wbem/wscim/1/cim-schema/2/CIM_ResourceAllocationSettingData"
    xmlns:vssd="http://schemas.dmtf.org/wbem/wscim/1/cim-schema/2/CIM_VirtualSystemSettingData" cloudburst:name="POSTGRES-9.2.4-RHEL-64.X64.xxx.xxx"
    cloudburst:version="1.0.0" cloudburst:build="sample" cloudburst:serviceLevel="0"
    cloudburst:description="BASEIMAGE FOR POSTGRESQL 9.2.4" cloudburst:symbolicName="POSTGRES-9.2.4-RHEL-64.X64.xxx.xxx">
  <References>
    <File ovf:href="en-US-bundle.msg" ovf:id="en-US-bundle.msg" ovf:size="18526"/>
    <File ovf:href="de-DE-bundle.msg" ovf:id="de-DE-bundle.msg" ovf:size="20687"/>
    <File ovf:href="es-ES-bundle.msg" ovf:id="es-ES-bundle.msg" ovf:size="20364"/>
    <File ovf:href="fr-FR-bundle.msg" ovf:id="fr-FR-bundle.msg" ovf:size="20534"/>
    <File ovf:href="it-IT-bundle.msg" ovf:id="it-IT-bundle.msg" ovf:size="20138"/>
    <File ovf:href="ja-JP-bundle.msg" ovf:id="ja-JP-bundle.msg" ovf:size="23116"/>
    <File ovf:href="ko-KR-bundle.msg" ovf:id="ko-KR-bundle.msg" ovf:size="19114"/>
    <File ovf:href="pt-BR-bundle.msg" ovf:id="pt-BR-bundle.msg" ovf:size="20204"/>
    <File ovf:href="zh-CN-bundle.msg" ovf:id="zh-CN-bundle.msg" ovf:size="16875"/>
    <File ovf:href="zh-TW-bundle.msg" ovf:id="zh-TW-bundle.msg" ovf:size="18395"/>
    <File ovf:href="Automation.topology" ovf:id="Automation.topology" ovf:size="196121"/>
    <File ovf:href="Semantic.topology" ovf:id="Semantic.topology" ovf:size="34496"/>
    <File ovf:href="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis.vmdk" ovf:id="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis.vmdk"
        ovf:size="3129636864"/>
    <File ovf:href="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis_1.vmdk" ovf:id="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis_1.vmdk"
        ovf:size="470930944"/>
    <File ovf:href="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis_2.vmdk" ovf:id="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis_2.vmdk"
        ovf:size="597504"/>
    <File ovf:href="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis_3.vmdk" ovf:id="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis_3.vmdk"
        ovf:size="8147968"/>
    <File ovf:href="default1382090373335.xml" ovf:id="default1382090373335.xml"
        ovf:size="17914" cloudburst:part2Definition="true"/>
    <File ovf:href="default1382090373335C.xml" ovf:id="default1382090373335C.xml"
        ovf:size="15854" cloudburst:part2Definition="true"/>
  </References>
</Envelope>

(这只是第一个父节点,下面还有更多,但我认为知道如何做第一部分,剩下的会更容易)

它必须看起来像这样:

<?xml version="1.0" encoding="UTF-8"?>
<!-- Built using IBM Image Construction and Composition Tool, version: 1.2.0.1-20121129-1310-255 on: Oct 18, 2013 12:14:22 -->
<Envelope
    xmlns="http://schemas.dmtf.org/ovf/envelope/1" xmlns:ovf="http://schemas.dmtf.org/ovf/envelope/1"
    xmlns:cloudburst="http://www.ibm.com/websphere/rainmaker/2009/3" xmlns:rasd="http://schemas.dmtf.org/wbem/wscim/1/cim-schema/2/CIM_ResourceAllocationSettingData"
    xmlns:vssd="http://schemas.dmtf.org/wbem/wscim/1/cim-schema/2/CIM_VirtualSystemSettingData" cloudburst:name="POSTGRES-9.2.4-RHEL-64.X64.xxx.xxx"
    cloudburst:version="1.0.0" cloudburst:build="sample" cloudburst:serviceLevel="0"
    cloudburst:description="BASEIMAGE FOR POSTGRESQL 9.2.4" cloudburst:symbolicName="POSTGRES-9.2.4-RHEL-64.X64.xxx.xxx">
  <References>
    <File ovf:href="en-US-bundle.msg" ovf:id="en-US-bundle.msg" ovf:size="18526"/>
    <File ovf:href="Automation.topology" ovf:id="Automation.topology" ovf:size="196121"/>
    <File ovf:href="Semantic.topology" ovf:id="Semantic.topology" ovf:size="34496"/>
    <File ovf:href="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis.vmdk" ovf:id="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis.vmdk"
        ovf:size="3129636864"/>
    <File ovf:href="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis_1.vmdk" ovf:id="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis_1.vmdk"
        ovf:size="470930944"/>
    <File ovf:href="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis_2.vmdk" ovf:id="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis_2.vmdk"
        ovf:size="597504"/>
    <File ovf:href="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis_3.vmdk" ovf:id="RedHat6-4-64-Base-PRB-HARDENEDv1-1-bis_3.vmdk"
        ovf:size="8147968"/>
    <File ovf:href="default1382090373335.xml" ovf:id="default1382090373335.xml"
        ovf:size="17914" cloudburst:part2Definition="true"/>
    <File ovf:href="default1382090373335C.xml" ovf:id="default1382090373335C.xml"
        ovf:size="15854" cloudburst:part2Definition="true"/>
  </References>
</Envelope>

正如你所看到的,我要做的是选择所有File包含“bundle”的节点并删除它们,除了第一个(包含en-US)。我写的选择它们的 xPath 是

/Envelope/References/File[contains(@ovf:href, 'bundle')][position()>1]

(我遇到了麻烦,因为 - 我认为 - 所有的命名空间,但我在 Altova XMLspy 中尝试过它并且它完美地工作)

由于我从未使用过 XSL 编程,因此它与我所知道的(主要是 C、Java、PHP、VB.net...)有点不同,但我知道 HTML,所以我知道基本结构。

File所以,我的问题是,如果 XSL 复制整个 XML 但忽略该节点子集,会是什么样子?

这不起作用,我从我之前链接的那个 SO 答案中复制了它

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:fo="http://www.w3.org/1999/XSL/Format" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:fn="http://www.w3.org/2005/xpath-functions" >

    <xsl:template match="node() | @*">
        <xsl:copy>
            <xsl:apply-templates select="node() | @*"/>
        </xsl:copy>
    </xsl:template>
    <xsl:template match="/Envelope/References/File[contains(@href, 'bundle')][position()>1]"/> <!-- this empty template will remove them -->
</xsl:stylesheet>

我认为使用 XSL v1 或 v2 并不重要,实际上我不知道它们之间的区别 :D

谢谢

4

1 回答 1

1

这是因为命名空间。在您的输入 XML 中,您已经定义了一个默认命名空间xmlns="http://schemas.dmtf.org/ovf/envelope/1和一个ovf命名空间xmlns:ovf="http://schemas.dmtf.org/ovf/envelope/1File元素属于默认命名空间,@href属性属于ovf命名空间。这些命名空间恰好是相等的。

您需要在 XSLT 中定义相同的名称空间,然后使用该名称空间匹配元素和属性。(请注意,您可以随意调用命名空间,只要它的值与输入中的相应值匹配即可。我在下面将其称为ns。)

以下样式表将删除除File包含“bundle”的第一个节点之外的所有节点。

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="2.0" 
                xmlns:xsl="http://www.w3.org/1999/XSL/Transform" 
                xmlns:ns="http://schemas.dmtf.org/ovf/envelope/1">
  <xsl:output method="xml" indent="yes" />
  <xsl:strip-space elements="*"/>

  <xsl:template match="node() | @*">
    <xsl:copy>
      <xsl:apply-templates select="node() | @*"/>
    </xsl:copy>
  </xsl:template>

  <!-- this empty template will remove them -->
  <xsl:template match="ns:Envelope/ns:References/ns:File[contains(@ns:href, 'bundle')][position()>1]"/>
</xsl:stylesheet>
于 2013-10-22T12:05:51.920 回答