我有如下 XML:
<w:body>
<w:p>
<w:pPr>
<w:pStyle w:val="paragraph"/>
</w:pPr>
<w:r><w:t>1274394 The milk costs , $1.99 [12] test Figure 1</w:t></w:r>
</w:p>
<w:p>
<w:pPr>
<w:pStyle w:val="paragraph"/>
</w:pPr>
<w:r><w:t>sample text Figure 1 and [1]</w:t></w:r>
</w:p>
</w:body>
我想用 XSLT 得到如下输出:
<w:body>
<w:p>
<w:pPr>
<w:pStyle w:val="paragraph"/>
</w:pPr>
<w:r><w:t>1274394 The milk costs , $1.99 <ref>[12]</ref> test <fig>Figure 1</fig></w:t></w:r>
</w:p>
<w:p>
<w:pPr>
<w:pStyle w:val="paragraph"/>
</w:pPr>
<w:r><w:t>sample text <fig>Figure 1</fig> and <ref>[1]</ref></w:t></w:r>
</w:p>
</w:body>
我的 XSLT 是:
<xsl:template match="w:p[w:pPr/w:pStyle/@w:val='paragraph']//text()">
<xsl:param name="figregex">
<xsl:text>(Figure)\p{Zs}([0-9]{1,2})</xsl:text>
</xsl:param>
<xsl:param name="matchedRegex">
<xsl:text>(\[)([0-9]{1,2})(\])</xsl:text>
</xsl:param>
<xsl:variable name="fig-first" select=""<fig>""/>
<xsl:variable name="fig-sec" select=""</fig>""/>
<xsl:variable name="r-first" select=""<ref>""/>
<xsl:variable name="r-sec" select=""</ref>""/>
<xsl:analyze-string select="." regex="{$matchedRegex} | {$figregex} ">
<xsl:matching-substring>
<xsl:if test="matches(., $figregex)" >
<xsl:value-of select="$fig-first" disable-output-escaping="yes"/><xsl:value-of select="."/>
<xsl:value-of select="$fig-sec" disable-output-escaping="yes"/>
</xsl:if>
<xsl:if test="matches(., $matchedRegex)" >
<xsl:value-of select="$r-first" disable-output-escaping="yes"/><xsl:value-of select="."/>
<xsl:value-of select="$r-sec" disable-output-escaping="yes"/>
</xsl:if>
</xsl:matching-substring>
<xsl:non-matching-substring>
<xsl:value-of select="."/>
</xsl:non-matching-substring>
</xsl:analyze-string>
</xsl:template>
它工作正常,但如果两者都出现在同一行中,那么前面的第一个首先会被转换。谁可以帮我这个事?我得到的输出是:
<w:body>
<w:p>
<w:pPr>
<w:pStyle w:val="paragraph"/>
</w:pPr>
<w:r><w:t>1274394 The milk costs , $1.99 <ref>[12] </ref>test Figure 1</w:t></w:r>
</w:p>
<w:p>
<w:pPr>
<w:pStyle w:val="paragraph"/>
</w:pPr>
<w:r><w:t>sample text<fig> Figure 1 </fig>and [1]</w:t></w:r>
</w:p>
</w:body>