我有以下代码段,我想用它来抓取除了第一组字符之外的所有内容,第一组字符本质上是 1 到 4 位的数字。字符组由空格分隔。我尝试了几种使用标记化的方法,但没有成功。我可以一次获得第二个、第三个或第四个项目,但不能一次获得所有项目。
这是我的源文件:
<html>
<head>
<title></title>
</head>
<body>
<!-- This is my first comment -->
<ol>
<li>1 data</li>
<li>2 data</li>
<li>3 data</li>
<li>4 data</li>
<li>5 data additional data</li>
<li>6 data</li>
<li>7 data</li>
<li>8 data</li>
<li>9 data</li>
<li>1055 data</li>
<li>1100 data</li>
<li>1247 data</li>
<li>1345 data more data</li>
</ol>
</body>
</html>
这是我的剪辑:
<xsl:template match="li">
<document>
<title>
<xsl:variable name="test" select="text()"/>
<xsl:value-of select="tokenize($test, ' ')[2]"/>
</title>
<doc:id>
<xsl:number value="substring-before(., ' ')"/>
</doc:id>
</document>
</xsl:template>