我需要删除所有 HTML 标签,除了一些被列入白名单但内容应该保留的标签。例如:
<root>
<item>
<p><img height="269" alt="" hspace="5" src="[some src]" width="200" align="right" />Sample TEXT <strong>Sample text</strong> <em>Sample text text text</em> </p>
</item>
</root>
我希望在上面的示例中删除所有 HTML 格式,但保留强标记,并且所有文本信息都应该保留。所以代码将被转换成这样的东西:
<root>
<item>
Sample TEXT <strong>Sample text</strong> Sample text text text
</item>
</root>
为此目的, xslt(1.0 版)会是什么样子?