0

我正在使用简单的 HTML DOM,在某些网站上使用它时会得到奇怪的结果。

这是它从此链接生成的 HTML 输出

���������������� 

我检查了来源,这是一团糟。

每当我尝试在此站点上使用它时它也会挂起同样,HTML 是一团糟。

有任何想法吗?

编辑:添加代码块:

下面的$str变量是在我的 CURL 请求中的代码中定义的。

我正在使用 CURL 请求

$html = str_get_html($str);
$images = array();
if($html !='') {
    foreach($html->find('img') as $element) {
        if(strtolower(substr($element->src, -4)) != '.gif') {
            $images[] = url_to_absolute($baseURL, $element->src);
            }
    }
}
4

2 回答 2

0

我有这个问题,但不是字符集问题是简单的html dom无法处理的gzip压缩这是我的解决方案 简单的html dom字符编码问题

于 2012-06-22T13:28:42.250 回答
0

� 总是看起来像一个编码问题。

也许utf8_decode / utf8_encode 可以提供帮助。

于 2012-01-18T08:56:44.993 回答