我建议你应该使用 PHP 的DOM Library。它非常强大,可以解析任何 DOM 结构。参考它的一些示例,您可以轻松实现它。
这个想法是你研究谷歌返回的页面的 HTML 结构,并相应地使用 DOM 库来解析特定的标签。从我所看到的,图像被组织为<ul>
和<li>
标签,如:
<ul class="rg_ul" data-pg="1" data-cnt="6">
<li class="rg_li" data-row="1" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:231px;height:162px"></li>
<li class="rg_li" style="width:218px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:217px;height:162px"></li>
</ul>
在每个<li>
标签中都有其他标签,其中之一是<a>
. 这个标签似乎有 2 个属性——“imgrefurl”和“imgurl”——这可能会给你你需要的图像。您需要这 2 个属性中的哪一个供您探索。
或者,其中有一个<img>
标签<li>
,其中包含一个包含实际图像二进制文件的“src”属性。所以你也可以解析它。请注意,二进制文件适用于您在搜索页面上看到的图像,而不是实际图像。
对于一些指向 DOM 的指针,此方法可能有用 - http://www.php.net/manual/en/domelement.getelementsbytagname.php和http://www.php.net/manual/en/domelement.hasattribute。 php - 读取所有<li>
标签,然后使用类“rg_li”解析标签。
我希望以上是有道理的