2

我有一个要求,我想根据条件从 xml 中删除一些标签。

这是我的输入xml:

<?xml version="1.0" encoding="UTF-8"?>
<TCXML xmlns="http://www.tcxml.org/Schemas/TCXMLSchema">
<File creation_date="2012-09-20T07:28:47Z" elemId="id280" exportedFileName="sheet 1" last_mod_date="2012-09-20T07:28:48Z" text_flag="8192">

    <GSIdentity elemId="id111" label="R0dB1SzBBT4jNA"/>

</File>
  <File creation_date="2012-09-20T07:18:26Z" elemId="id283"exportedFileName="test part" last_mod_date="2012-09-20T07:18:26Z"  text_flag="8192">

    <GSIdentity elemId="id31" label="SIWBFqLyBT4jNA"/>

</File>
  <File creation_date="2012-09-20T07:21:03Z" elemId="id322" exportedFileName="test part3"  last_mod_date="2012-09-20T07:21:03Z"  text_flag="8192">

    <GSIdentity elemId="id46" label="ycUBFqLyBT4jNA"/>

</File>
  <File creation_date="2012-09-20T07:18:25Z" elemId="id285" exportedFileName="test part2"  last_mod_date="2012-09-20T07:18:25Z"  text_flag="4096">

    <GSIdentity elemId="id29" label="SQRBFqLyBT4jNA"/>

</File>

  <Sheet creation_date="2012-09-20T07:28:48Z" date_released="" ead_paragraph="" elemId="id185"  keep_limit_prop="3" last_mod_date="2012-09-20T07:28:48Z"  object_desc="" object_name="Sheet 1"  ref_list="#id111">

    <GSIdentity elemId="id112" label="R4WB1SzBBT4jNA"/>

</Sheet>


  <PART creation_date="2012-09-20T07:21:22Z" date_released="" ead_paragraph="" elemId="id435"  keep_limit_prop="3" last_mod_date="2012-09-20T07:21:28Z" object_name="dwgTest-AA-dwg1" ref_list="#id29 #id31">

    <GSIdentity elemId="id32" label="SxZBFqLyBT4jNA"/>

</PART>
  <PART creation_date="2012-09-20T07:21:23Z" date_released="2012-09-20T07:21:27Z" ead_paragraph="" elemId="id438"  keep_limit_prop="3" last_mod_date="2012-09-20T07:21:29Z"  object_name="dwgTest-AA-dwg2" ref_list="#id46">

    <GSIdentity elemId="id21" label="itfBFqLyBT4jNA"/>

</PART>
</TCXML>

我想从此 xml 中删除那些在 PART 中使用 ref_list 标记引用的文件标记。

我正在尝试关注 xsl,

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"  xmlns:plm="http://www.tcxml.org/Schemas/TCXMLSchema" version="1.0">
  <xsl:output method="xml" indent="yes"/>

<xsl:template match="@*|node()">
  <xsl:copy>
    <xsl:apply-templates select="@*|node()"/>
  </xsl:copy>
</xsl:template>

<xsl:template match="plm:File">

    <xsl:variable name="Ref_List" select="translate(/plm:TCXML/plm:PART/@ref_list,' ','')" />
    <xsl:variable name="currentElementGSId" select="plm:GSIdentity/@elemId" />  
    <xsl:variable name="RefcurrentElementGSId" select="concat(string('#'),$currentElementGSId)" />  
    <xsl:choose>
        <xsl:when test="((contains($Ref_List,$RefcurrentElementGSId))=true())" >
            </xsl:when>
    <xsl:otherwise>
        <xsl:copy>
            <xsl:apply-templates select="@*|node()" /> 
        </xsl:copy>         
    </xsl:otherwise>
    </xsl:choose>   
</xsl:template>

以上 xsl 仅适用于 xml 中的一个 PART,而不适用于 xml 中的所有 PART 标签,如何遍历 xml 中的所有 PART 标签。提前感谢您的帮助。

我正在寻找此 xml 的输出,如下所示,

<?xml version="1.0" encoding="UTF-8"?>
<TCXML xmlns="http://www.tcxml.org/Schemas/TCXMLSchema">
<File creation_date="2012-09-20T07:28:47Z" elemId="id280" exportedFileName="sheet 1" last_mod_date="2012-09-20T07:28:48Z" text_flag="8192">

    <GSIdentity elemId="id111" label="R0dB1SzBBT4jNA"/>

</File>

  <Sheet creation_date="2012-09-20T07:28:48Z" date_released="" ead_paragraph="" elemId="id185"  keep_limit_prop="3" last_mod_date="2012-09-20T07:28:48Z"  object_desc="" object_name="Sheet 1"  ref_list="#id111">

    <GSIdentity elemId="id112" label="R4WB1SzBBT4jNA"/>

</Sheet>


  <PART creation_date="2012-09-20T07:21:22Z" date_released="" ead_paragraph="" elemId="id435"  keep_limit_prop="3" last_mod_date="2012-09-20T07:21:28Z" object_name="dwgTest-AA-dwg1" ref_list="#id29 #id31">

    <GSIdentity elemId="id32" label="SxZBFqLyBT4jNA"/>

</PART>
  <PART creation_date="2012-09-20T07:21:23Z" date_released="2012-09-20T07:21:27Z" ead_paragraph="" elemId="id438"  keep_limit_prop="3" last_mod_date="2012-09-20T07:21:29Z"  object_name="dwgTest-AA-dwg2" ref_list="#id46">

    <GSIdentity elemId="id21" label="itfBFqLyBT4jNA"/>

</PART>
</TCXML>
4

2 回答 2

2

更短更简单,最重要的是:正确的解决方案

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
 xmlns:x="http://www.tcxml.org/Schemas/TCXMLSchema">
 <xsl:output omit-xml-declaration="yes"/>

 <xsl:template match="node()|@*" name="identity">
     <xsl:copy>
       <xsl:apply-templates select="node()|@*"/>
     </xsl:copy>
 </xsl:template>

 <xsl:template match="x:File">
  <xsl:if test=
  "not(/*/x:PART/@ref_list
                 [contains(concat(.,' '),
                           concat('#',
                                  current()/x:GSIdentity/@elemId,
                                  ' ')
                           )
                 ])">
    <xsl:call-template name="identity"/>
  </xsl:if>
 </xsl:template>
</xsl:stylesheet>

当此转换应用于提供的 XML 文档时:

<TCXML xmlns="http://www.tcxml.org/Schemas/TCXMLSchema">
    <File creation_date="2012-09-20T07:28:47Z" elemId="id280"
      exportedFileName="sheet 1" last_mod_date="2012-09-20T07:28:48Z"
      text_flag="8192">
        <GSIdentity elemId="id111" label="R0dB1SzBBT4jNA"/>
    </File>
    <File creation_date="2012-09-20T07:18:26Z" elemId="id283"
      exportedFileName="test part" last_mod_date="2012-09-20T07:18:26Z"
      text_flag="8192">
        <GSIdentity elemId="id31" label="SIWBFqLyBT4jNA"/>
    </File>
    <File creation_date="2012-09-20T07:21:03Z" elemId="id322"
      exportedFileName="test part3"  last_mod_date="2012-09-20T07:21:03Z"
      text_flag="8192">
        <GSIdentity elemId="id46" label="ycUBFqLyBT4jNA"/>
    </File>
    <File creation_date="2012-09-20T07:18:25Z" elemId="id285"
      exportedFileName="test part2"  last_mod_date="2012-09-20T07:18:25Z"
      text_flag="4096">
        <GSIdentity elemId="id29" label="SQRBFqLyBT4jNA"/>
    </File>
    <Sheet creation_date="2012-09-20T07:28:48Z" date_released=""
      ead_paragraph="" elemId="id185"  keep_limit_prop="3"
      last_mod_date="2012-09-20T07:28:48Z"  object_desc=""
      object_name="Sheet 1"  ref_list="#id111">
        <GSIdentity elemId="id112" label="R4WB1SzBBT4jNA"/>
    </Sheet>
    <PART creation_date="2012-09-20T07:21:22Z" date_released=""
    ead_paragraph="" elemId="id435"  keep_limit_prop="3"
    last_mod_date="2012-09-20T07:21:28Z" object_name="dwgTest-AA-dwg1"
    ref_list="#id29 #id31">
        <GSIdentity elemId="id32" label="SxZBFqLyBT4jNA"/>
    </PART>
    <PART creation_date="2012-09-20T07:21:23Z" date_released="2012-09-20T07:21:27Z"
    ead_paragraph="" elemId="id438"  keep_limit_prop="3"
    last_mod_date="2012-09-20T07:21:29Z"  object_name="dwgTest-AA-dwg2"
    ref_list="#id46">
        <GSIdentity elemId="id21" label="itfBFqLyBT4jNA"/>
    </PART>
</TCXML>

产生了想要的正确结果(4个文件元素中的3个被“删除”):

<TCXML xmlns="http://www.tcxml.org/Schemas/TCXMLSchema">
    <File creation_date="2012-09-20T07:28:47Z" elemId="id280" exportedFileName="sheet 1" last_mod_date="2012-09-20T07:28:48Z" text_flag="8192">
        <GSIdentity elemId="id111" label="R0dB1SzBBT4jNA"/>
    </File>
    <Sheet creation_date="2012-09-20T07:28:48Z" date_released="" ead_paragraph="" elemId="id185" keep_limit_prop="3" last_mod_date="2012-09-20T07:28:48Z" object_desc="" object_name="Sheet 1" ref_list="#id111">
        <GSIdentity elemId="id112" label="R4WB1SzBBT4jNA"/>
    </Sheet>
    <PART creation_date="2012-09-20T07:21:22Z" date_released="" ead_paragraph="" elemId="id435" keep_limit_prop="3" last_mod_date="2012-09-20T07:21:28Z" object_name="dwgTest-AA-dwg1" ref_list="#id29 #id31">
        <GSIdentity elemId="id32" label="SxZBFqLyBT4jNA"/>
    </PART>
    <PART creation_date="2012-09-20T07:21:23Z" date_released="2012-09-20T07:21:27Z" ead_paragraph="" elemId="id438" keep_limit_prop="3" last_mod_date="2012-09-20T07:21:29Z" object_name="dwgTest-AA-dwg2" ref_list="#id46">
        <GSIdentity elemId="id21" label="itfBFqLyBT4jNA"/>
    </PART>
</TCXML>
于 2012-09-24T12:56:27.840 回答
1

您的输入/输出与您的描述不符:

我想从此 xml 中删除那些在 PART 中使用 ref_list 标记引用的文件标记。

以下 XSLT 执行与该描述相同的操作:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    xmlns:plm="http://www.tcxml.org/Schemas/TCXMLSchema" version="1.0">
    <xsl:output method="xml" indent="yes" />
    <xsl:template match="@*|node()">
        <xsl:copy>
            <xsl:apply-templates select="@*|node()" />
        </xsl:copy>
    </xsl:template>
    <xsl:template match="plm:File">
        <xsl:choose>
            <xsl:when test="/plm:TCXML/plm:PART[contains(
                concat(' ', @ref_list, ' '), 
                concat(' #', current()/@elemId, ' '))]">
            </xsl:when>
            <xsl:otherwise>
                <xsl:copy>
                    <xsl:apply-templates select="@*|node()" />
                </xsl:copy>
            </xsl:otherwise>
        </xsl:choose>
    </xsl:template>
</xsl:stylesheet>

第二个模板丢弃在任何File元素的属性中elemId找到的任何元素。所有其他元素都按原样复制。ref_listPARTFile

注意:您的模板无法按预期工作,因为translate它的第一个参数是字符串;您传递了一个节点列表,该列表根据以下规则转换为字符串:

通过返回节点集中在文档顺序中排在第一位的节点的字符串值,将节点集转换为字符串。如果节点集为空,则返回一个空字符串。

于 2012-09-24T06:15:00.607 回答