simple-html-dom - SimpleHTMLDOM Parser 不拾取 img 标签

Question

我一直在使用 SimpleHTMLDOM Parser (http://simplehtmldom.sourceforge.net/)，这是一个很棒的工具，但是，我遇到了从正文中收集 img 元素的问题。最好通过一个例子来说明这一点：

这是同一图像的 2 个 URL。我分别在这些 URL 上运行以下代码：

$html = $this->DOMParser->file_get_html($url);

foreach($html->find('img') as $element){
   print($element->src);
}

（SHTMLD 在这里提取图像）

和

（SHTMLD 什么都没有）

我已经尝试了几天来弄清楚发生了什么，但这个例子中唯一的不同在于 html 标签。

有任何想法吗？

score 0 · Accepted Answer

您的第二个 url 直接指向 jpeg 文件，而不是包含 img 标签的 html 页面。SimpleHTMLDOM Parser 只能解析 html 页面，因此当您向其提供图像文件而不是 html 页面时，它将无法工作。

score 0 · Accepted Answer

0

很简单，您的第二个 URL 不是 HTML，它是 Jpg！:)

于 2012-12-10T19:41:33.160 回答

2 回答 2