1

我想用php修改一个html文件的内容。我正在将样式应用于 img 标签,我需要检查标签是否已经具有样式属性,如果有,我想用我自己的替换它。

$pos = strpos($theData, "src=\"".$src."\" style=");
    if (!$pos){
        $theData = str_replace("src=\"".$src."\"", "src=\"".$src."\" style=\"width:".$width."px\"", $theData);
    }
    else{
        $theData = preg_replace("src=\"".$src."\" style=/\"[^\"]+\"/", "src=\"".$src."\" style=\"width: ".$width."px\"", $theData);
    }

$theData 是我收到的 html 源代码。如果没有找到样式属性,我成功地插入了自己的样式,但我认为问题在于已经定义了样式属性,因此我的正则表达式不起作用。

我想用我的新样式属性将样式属性替换为其中的所有内容。我的正则表达式应该如何?

4

4 回答 4

4

您应该使用 DOM 解析器,而不是为此使用正则表达式。

使用DOMDocument的示例:

<?php
$html = '<img src="http://example.com/image.jpg" width=""/><img src="http://example.com/image.jpg"/>';

libxml_use_internal_errors(true);
$dom = new DOMDocument();
$dom->loadHTML('<meta http-equiv="Content-Type" content="text/html;charset=utf-8" />'.$html);
$dom->formatOutput = true;

foreach ($dom->getElementsByTagName('img') as $item)
{
    //Remove width attr if its there
    $item->removeAttribute('width');

    //Get the sytle attr if its there
    $style = $item->getAttribute('style');

    //Set style appending existing style if necessary, 123px could be your $width var
    $item->setAttribute('style','width:123px;'.$style);
}
//remove unwanted doctype ect
$ret = preg_replace('~<(?:!DOCTYPE|/?(?:html|body|head))[^>]*>\s*~i', '', $dom->saveHTML());
echo trim(str_replace('<meta http-equiv="Content-Type" content="text/html;charset=utf-8">','',$ret));

//<img src="http://example.com/image.jpg" style="width:123px;">
//<img src="http://example.com/image.jpg" style="width:123px;">

?>
于 2013-06-19T08:44:23.397 回答
1

这是解决此问题的正则表达式变体:

<?php
$theData = "<img src=\"/image.png\" style=\"lol\">";
$src = "/image.png";
$width = 10;

//you must escape potential special characters in $src, 
//before using it in regexp
$regexp_src = preg_quote($src, "/");

$theData = preg_replace(
    '/src="'. $regexp_src .'" style=".*?"/i',
    'src="'. $src .'" style="width: '. $width . 'px;"',
    $theData);

print $theData;

印刷:

<img src="/image.png" style="width: 10px;">
于 2013-06-19T08:50:46.893 回答
0

正则表达式:

(<[^>]*)style\s*=\s*('|")[^\2]*?\2([^>]*>)

用法:

$1$3

例子:

http://rubular.com/r/28tCIMHs50

于 2013-06-19T08:28:29.080 回答
0

搜索:

<img([^>])style="([^"])"

并替换为:

<img\1style="attribute1: value1; attribute2: value2;"

http://regex101.com/r/zP2tV9

于 2013-06-19T08:44:35.153 回答