4

我正在尝试删除嵌入 html 文件的任何注释

$data= file_get_contents($stream); <br>
$data = preg_replace('<!--*-->', '', $data); <br>
echo $data;

我仍然以所有评论结束<!- bla bla bla -->
我做错了什么?

4

8 回答 8

5
// Remove unwanted HTML comments
function remove_html_comments($content = '') {
    return preg_replace('/<!--(.|\s)*?-->/', '', $content);
}

正如你可以在这里阅读:https ://davidwalsh.name/remove-html-comments-php

于 2020-07-30T08:01:38.023 回答
3

下面的正则表达式将删除 HTML 注释,但会保留条件注释。

<!--(?!<!)[^\[>].*?-->
于 2012-07-05T02:58:14.357 回答
2

您可以在不使用正则表达式的情况下做到这一点:

function strip_comments($html)
{
    $html = str_replace(array("\r\n<!--", "\n<!--"), "<!--", $html);
    while(($pos = strpos($html, "<!--")) !== false)
    {
        if(($_pos = strpos($html, "-->", $pos)) === false)
            $html = substr($html, 0, $pos);
        else
            $html = substr($html, 0, $pos) . substr($html, $_pos+3);
    }
    return $html;
}
于 2013-08-14T02:31:20.107 回答
0
  1. 正则表达式很难在这里做你想做的事情。

  2. 要匹配正则表达式中的任意文本,您需要.*,而不仅仅是*. 您的表达式正在寻找<!-,后跟零个或多个-字符,然后是-->

于 2012-07-05T02:56:39.643 回答
0

s/<!--[^>]*?-->//g

切换正则表达式

于 2012-07-05T02:57:16.230 回答
0

我知道很多答案已经发布了。我已经尝试了很多,但对我来说,这个正则表达式适用于多行(在我的情况下为 40 行评论)HTML 评论删除。

$string = preg_replace("~<!--(.*?)-->~s", "", $string);

干杯:)

于 2019-02-16T11:13:24.037 回答
0

我不会使用正则表达式来完成这样的任务。正则表达式可能会因意外字符而失败。
相反,我会做一些安全的事情,比如:

$linesExploded = explode('-->', $html);
foreach ($linesExploded as &$line) {
    if (($pos = strpos($line, '<!--')) !== false) {
        $line = substr($line, 0, $pos);
    }
}
$html = implode('', $linesExploded);
于 2021-06-14T17:16:54.280 回答
-2

你应该这样做:

$str = "<html><!-- this is a commment -->OK</html>";
$str2 = preg_replace('/<!--.*-->/s', '', $str);
var_dump($str2);
于 2012-07-05T03:00:41.937 回答