1

我需要清理一个 html 字符串,但我需要保留一个自定义标记,例如:

<CUSTOM_TAG/>

我使用'tidy_repair_string()' php 函数。

$str = '<div><CUSTOM_TAG/><br><span>my little html</span></div>';
$tidy_config = array();
$tidy_text = tidy_repair_string($str, $tidy_config, 'utf8');

我没有找到任何可以帮助我的Tidy 选项。任何的想法 ?

提前,谢谢。


我找到了解决方案:

您需要使用的 Tidy 选项是:“'input-xml' => true”。谢谢大家的调查!!

4

3 回答 3

2

您需要使用的 Tidy 选项是:“'input-xml' => true”。谢谢大家的调查!!

于 2013-05-24T13:43:56.540 回答
0

strip_tags( )应该能够做你想做的事。您可以给它一个要跳过的标签列表。

例子:

$str = '<div><CUSTOM_TAG/><br><span>my little html</span></div>';
$tidy_text = strip_tags( $str, "<CUSTOM_TAG>" );
于 2013-05-24T09:20:17.687 回答
0

<CUSTOM_TAG>您需要通过指定new-blocklevel-tags配置选项来告诉 Tidy是有效的。您可能还需要添加它以new-empty-tags使其在没有内容或属性的情况下接受它,否则它可能会将其剥离。

于 2013-05-24T09:27:25.387 回答