1

如何精确匹配多个 img 标签实例?我阅读了一些关于 preg_match 的教程,但从来没有真正理解过。

我有这个作为我的基础:

<img src="http://example.com/1.png" alt="Example" />

<img class="Class" src="http://example.com/2.jpg" alt="Example 2" />

我做了一个小的像正则表达式:

<img (src="|class="Class" src=")http://.+\.(?:jpe?g|png)" alt="

在此之后,我被卡住了。如何继续匹配所有字符串直到两个字符串结束?

我发现了 PHP 网站本身的数组部分:

preg_match('@^(?:http://)?([^/]+)@i',
    "http://www.php.net/index.html", $matches);
$host = $matches[1];

使用我的代码,如何获取图像 URL 和 alt 标签?

谢谢!

4

2 回答 2

1

对于原始问题,使用preg_match_all()函数获取所有匹配项。

对于第二个问题(“使用我的代码,我如何获取图像 URL 和 alt 标签?”),基本上你的正则表达式是正确的。但是,我建议先获取整个<img>标签,然后再preg_match()获取hrefandalt属性,因为它们的顺序可能会有所不同。

$html = "<img src='test.jpg' alt='aaaaaaaaaaa!'>  adfa <img src='test2.jpg' alt='aaaaaaaaaaa2'>  ";

$pattern = '/<img\s[^>]*>/';
$count = preg_match_all($pattern, $html, $matches, PREG_SET_ORDER);

echo "Found: " . $count . "\n";
if ($count > 0) {
    foreach ($matches as $match) {
        $img = $match[0];
        echo "img: " . $img . "\n";
        if (preg_match("/src=['\"]([^'\"]*)['\"]/", $img, $val)) {  # UPDATE: use () to catch the content of src
            $src = $val[1];      # UPDATE: get the part in ()
        }
        if (preg_match("/alt=['\"]([^'\"]*)['\"]/", $img, $val)) {   # UPDATE
            $alt = $val[1];      # UPDATE
        }

        echo "src = " . $src . ", alt = " . $alt . "\n";
    }
}

更新

回答您的评论。当然。只需使用一个组来捕捉后面的部分src=。我更新了上面的源代码并用“更新”进行了评论。

于 2012-10-02T06:35:23.307 回答
1

为什么不DOMDocument呢?无论图像如何编写,您都可以获得所有属性:

$string = '<img class="Class" src="http://example.com/2.jpg" alt="Example 2" />';

$dom = new DOMDocument;
$dom->loadHTML($string);
$xpath = new DOMXPath($dom);

$query = '//img';
$elements = $xpath->query($query);

$attributes = array();
$i = 0;
foreach($elements as $one){
    foreach($one->attributes as $att){
        $attributes[$i][$att->nodeName] = $att->nodeValue;
    }
    $i++;
}
print_r($attributes);

/*Array
(
    [0] => Array
        (
            [class] => Class
            [src] => http://example.com/2.jpg
            [alt] => Example 2
        )

)*/
于 2012-10-02T06:35:25.543 回答