-2

代码 :

$html = file_get_html('http://url.com');
$ret = $html->find('div[samplediv]');
echo $ret;

我得到的输出只是数组。这意味着它是空的。我确信 div 是在我正在抓取的页面上预设的。

另外,我想要实现的另一件事是,从 html 中获取文本。当我简单地将其转换为纯文本时,会产生很多不需要的数字和东西。所以我想做的是,获取我在浏览器中看到的文本。(而不是从 html 中获取整个文本)。

欢迎所有建议。

4

1 回答 1

8

看起来您正在输出整个文档。尝试

echo $ret->innertext;

只输出div的内容。

PS:我只是在谷歌上查了一下,发现http://simplehtmldom.sourceforge.net/manual.htm

于 2012-04-29T17:04:41.297 回答