1

我们收到的文件是这样错误生成的:

<html>
    <body>
        <p>Lorem Ipsum is simply dummy text of the printing and typesetting industry. 
            <p>Lorem Ipsum has been the industry's standard dummy text ever since the 1500s, when an unknown printer took a galley of type and scrambled it to make a type specimen book. 
                <p>It has survived not only five centuries, but also the leap into electronic typesetting, remaining essentially unchanged.</p>
            </p>
        </p>
    </body>
</html>

这些<p>元素被嵌入到先前的<p>节点中。它应该看起来像这样:

<html>
    <body>
        <p>Lorem Ipsum is simply dummy text of the printing and typesetting industry.</p>
        <p>Lorem Ipsum has been the industry's standard dummy text ever since the 1500s, when an unknown printer took a galley of type and scrambled it to make a type specimen book.</p>
        <p>It has survived not only five centuries, but also the leap into electronic typesetting, remaining essentially unchanged.</p>
    </body>
</html>

我们无法控制向我们发送文档的应用程序。我们如何使用 XSL 转换此文档,以便仅将子节点(及其内容)呈现为兄弟节点?

4

2 回答 2

2

如果以这种方式生成的唯一元素是 p,您将需要为 p 编写一个模板,该模板首先为所有属性和非 p 子元素调用 apply-templates,然后将模板应用于嵌入的 p 元素。在 XSLT 2.0 语法中:

<xsl:template match="p">
  <p><xsl:apply-templates select="node() except p"/></p>
  <xsl:apply-templates select="p"/>
</xsl:template>

样式表的其余部分将需要执行身份转换。

如果其他元素也在输入中不恰当地自嵌套,则需要类似地处理它们。

如果您使用的是 XSLT 1.0 而不是 2.0,则需要找到其他方法来区分属于 p 内部的事物和之后应该发生的事物,因为node() except p在 XSLT 1.0 选择值中是不合法的。我自己会使用模式:

<xsl:template match="p">
  <p><xsl:apply-templates mode="para-contents"/></p>
  <xsl:apply-templates select="p"/>
</xsl:template>

<xsl:template match="node()" mode="para-contents">
  <xsl:apply-templates select="."/>
</xsl:template>
<xsl:template match="p" mode="para-contents"/>

或者(正如 Ian Roberts 在评论中建议的那样)只需替换node() except pnode()[not(self::p)].

这假设 p 以外的某些元素可能出现在您输入的主体元素中;如果除了 p 什么都没有发生,Nils Werner 提供的解决方案就可以了。

然而,在现实生活中,如果我必须像这样处理输入,我可能会在它上面运行 Tidy,而不是滚动我自己的 XSLT 样式表来完成 Tidy 所做的一小部分工作。

于 2013-07-03T16:13:38.903 回答
0

您可以尝试以下方法:

<?xml version='1.0'?>
<xsl:stylesheet
    version='1.0'
    xmlns:xsl='http://www.w3.org/1999/XSL/Transform'>

<xsl:output method="xml" 
    indent="yes" />

<xsl:template match="/">
    <xsl:apply-templates select="html/body/*" mode="fixnested" />
</xsl:template>

<xsl:template match="*" mode="fixnested">
    <xsl:element name="{name()}">
        <xsl:apply-templates select="@* | text()" mode="fixnested" />
    </xsl:element>
    <xsl:apply-templates select="*" mode="fixnested" />
</xsl:template>

<xsl:template match="@*" mode="fixnested">
    <xsl:attribute name="{name(.)}">
        <xsl:value-of select="."/>
    </xsl:attribute>
</xsl:template>

</xsl:stylesheet>

正如您所看到的,我将它非常抽象,因此您可以将任何 XML 提供给它(不仅仅是嵌套<p>的 's)并将其展平。这些模板保留了属性和内容。

于 2013-07-03T16:00:25.517 回答