1

我一直在使用 SimpleHTMLDOM Parser (http://simplehtmldom.sourceforge.net/),这是一个很棒的工具,但是,我遇到了从正文中收集 img 元素的问题。最好通过一个例子来说明这一点:

这是同一图像的 2 个 URL。我分别在这些 URL 上运行以下代码:

$html = $this->DOMParser->file_get_html($url);

foreach($html->find('img') as $element){
   print($element->src);
}

http://imageshack.us/photo/my-images/412/71banksy89789ll7.jpg/

(SHTMLD 在这里提取图像)

http://imageshack.us/scaled/landing/412/71banksy89789ll7.jpg

(SHTMLD 什么都没有)

我已经尝试了几天来弄清楚发生了什么,但这个例子中唯一的不同在于 html 标签。

有任何想法吗?

4

2 回答 2

0

您的第二个 url 直接指向 jpeg 文件,而不是包含 img 标签的 html 页面。SimpleHTMLDOM Parser 只能解析 html 页面,因此当您向其提供图像文件而不是 html 页面时,它将无法工作。

于 2012-12-10T19:38:32.287 回答
0

很简单,您的第二个 URL 不是 HTML,它是 Jpg!:)

于 2012-12-10T19:41:33.160 回答