2

我是正则表达式的新手,我尝试了很多方法来获取锚标记 html 中的图像标记值,这是我的 html 表达式

<div class="smallSku" id="ctl00_ContentPlaceHolder1_smallImages">
                                <a title="" name="http://www.playg.in/productImages/med/PNC000051_PNC000051.jpg" href="http://www.playg.in/productImages/lrg/PNC000051_PNC000051.jpg" onclick="return showPic(this)" onmouseover="return showPic(this)">
    <img border="0" alt="" src="http://www.playg.in/productImages/thmb/PNC000051_PNC000051.jpg"></a>    <a title="PNC000051_PNC000051_1.jpg" name="http://www.playg.in/productImages/med/PNC000051_PNC000051_1.jpg" href="http://www.playg.in/productImages/lrg/PNC000051_PNC000051_1.jpg" onclick="return showPic(this)" onmouseover="return showPic(this)">
    <img border="0" alt="PNC000051_PNC000051_1.jpg" src="http://www.playg.in/productImages/thmb/PNC000051_PNC000051_1.jpg"></a>
                        </div>

我只想返回图像标签的 src 值,我在“preg_match_all()”中尝试了一个匹配模式,该模式是

"@<div[\s\S]class="smallSku"[\s\S]id="ctl00_ContentPlaceHolder1_smallImages"\><a title=\"\" name="[\w\W]" href="[\w\W]" onclick=\"[\w\W]" onmouseover="[\w\W]"\><img[\s\S]src="(.*)"[\s\S]></a><\/div>@"

请帮助我为此尝试了很多时间也尝试使用此链接使用正则表达式匹配未嵌套在锚标记中的图像标记

4

2 回答 2

5

正则表达式不是解析 HTML 的正确工具。请参阅此常见问题解答:如何解析和处理 HTML/XML?

以下是有关如何src使用您的示例获取属性的示例:

$doc = new DOMDocument();
$doc->loadHTML($your_html_string);
$xpath = new DOMXPath($doc);

foreach ($xpath->query('//div[@class="smallSku"]/a/img/@src') as $attr) {
    $src = $attr->value;
    print $src;
}
于 2013-04-23T05:30:44.880 回答
2

试试这个太阳

    $content = file_get_contents('your url'); 
    preg_match_all("|<div class='items'>.*</div>|", $content, $arr, PREG_PATTERN_ORDER);  
preg_match_all("/src='([^']+)'/", $arr[0][0], $arrr, PREG_PATTERN_ORDER); 
    echo '<pre>'; 
    print_r($arrr);
于 2013-04-24T09:16:33.943 回答