1

我只想在保存到数据库之前从 html 字符串中删除注释和空格。我不希望它被修复并添加头部标签等。

我花了几个小时搜索这个但找不到任何东西,做过这个的人可以告诉我我需要什么配置以及哪个 php tidy 函数只会“缩小”而不尝试从 html 字符串制作有效的 html 文档?

4

2 回答 2

0

下面的例子可以帮助你:

<?php
function html2txt($document){
$search = array('@<script[^>]*?>.*?</script>@si',  // Strip out javascript
               '@<[\/\!]*?[^<>]*?>@si',            // Strip out HTML tags
               '@<style[^>]*?>.*?</style>@siU',    // Strip style tags properly
               '@<![\s\S]*?--[ \t\n\r]*>@'         // Strip multi-line comments including CDATA
);
$text = preg_replace($search, '', $document);
return $text;
}
?> 

您可以在http://php.net/manual/en/function.strip-tags.php获得更多信息

于 2013-11-03T08:43:36.807 回答
0

你可以试试这个,

下面的函数用于删除不需要的 HTML 注释和空白,

      function remove_html_comments_white_spaces($content = '') {    

                  $content = preg_replace('~>\s+<~', '><', $content);
                  $content = preg_replace('/<!--(.|\s)*?-->/', '', $content);

            return $content;
        }

即使你想删除标签,你也可以使用 PHP 内置函数 strip_tags();

于 2013-11-03T09:01:07.367 回答