我一直在使用 SimpleHTMLDOM Parser (http://simplehtmldom.sourceforge.net/),这是一个很棒的工具,但是,我遇到了从正文中收集 img 元素的问题。最好通过一个例子来说明这一点:
这是同一图像的 2 个 URL。我分别在这些 URL 上运行以下代码:
$html = $this->DOMParser->file_get_html($url);
foreach($html->find('img') as $element){
print($element->src);
}
http://imageshack.us/photo/my-images/412/71banksy89789ll7.jpg/
(SHTMLD 在这里提取图像)
和
http://imageshack.us/scaled/landing/412/71banksy89789ll7.jpg
(SHTMLD 什么都没有)
我已经尝试了几天来弄清楚发生了什么,但这个例子中唯一的不同在于 html 标签。
有任何想法吗?