-1

首先很抱歉,因为很难解释我想要做什么。

我用 php 制作了一个爬虫并使用函数 getElementsByTag() 来获取我想要的一些标签,例如我想从网站上获取一些 img 但不是按类别分类,所以我无法过滤。代码如下:

<div class="separator" style="clear: both; text-align: center;">
<a href="www.xxx.com" target="_blank"><img alt="Athletic de Bilbao" border="0" src="http://2.bp.blogspot.com/-2UBftyhYArw/T0v9vguvZuI/AAAAAAAAA9s/vLQ8GSo6v5A/s1600/athletic.png" title="Athletic de Bilbao" /></a></div>
<img border="0" src="www.xxx.com/TOl2NhAAFBI/AAAAAAAAAJk/KxHrumDQ48M/s1600/down.gif" /> <b style="color: red;">Bajas</b> <br />
<ul>

我在想我得到的唯一机会是获取标签 div(分隔符),然后使用任何功能访问内部的图像标签,但我不知道是否可以使用任何功能?

4

1 回答 1

1

您可以将其编写为Xpath 表达式,例如获取所有此类图像的列表:

//div[@class="separator"]/img

您可以在 PHP 中使用DOMXPath.

与 一样DOMDocument::getElementsByTagName(),也DOMXPath::query()返回 a DOMNodeList

于 2012-12-31T16:32:20.123 回答