我只想在保存到数据库之前从 html 字符串中删除注释和空格。我不希望它被修复并添加头部标签等。
我花了几个小时搜索这个但找不到任何东西,做过这个的人可以告诉我我需要什么配置以及哪个 php tidy 函数只会“缩小”而不尝试从 html 字符串制作有效的 html 文档?
下面的例子可以帮助你:
<?php
function html2txt($document){
$search = array('@<script[^>]*?>.*?</script>@si', // Strip out javascript
'@<[\/\!]*?[^<>]*?>@si', // Strip out HTML tags
'@<style[^>]*?>.*?</style>@siU', // Strip style tags properly
'@<![\s\S]*?--[ \t\n\r]*>@' // Strip multi-line comments including CDATA
);
$text = preg_replace($search, '', $document);
return $text;
}
?>
你可以试试这个,
下面的函数用于删除不需要的 HTML 注释和空白,
function remove_html_comments_white_spaces($content = '') {
$content = preg_replace('~>\s+<~', '><', $content);
$content = preg_replace('/<!--(.|\s)*?-->/', '', $content);
return $content;
}
即使你想删除标签,你也可以使用 PHP 内置函数 strip_tags();