0

我下载了 simple_html_dom.php 文件并将其上传到我的网络服务器,然后我立即用一个简单的脚本对其进行了测试,但它不起作用,或者至少我认为它不起作用,因为它不输出任何内容。

这是脚本:

<?php
require('simple_html_dom.php');

// Retrieve the DOM from a given URL
$html = file_get_html('http://davidwalsh.name/');

// Find all "A" tags and print their HREFs
foreach($html->find('a') as $e) {
    echo $e->innertext . '<br>';
}
?>

我从这个网站http://davidwalsh.name/php-notifications得到了脚本,并且在其他网站上也有同样的内容,所以我不明白为什么它不会输出任何东西。

我的猜测是脚本无法从其他网站检索任何数据,就像我在这里遇到的问题:检索跨域数据 php

如果是这样,有什么办法可以避免这个问题吗?

在 BIno Carlos 对我之前链接的问题的回答中,他说“这不是真正的跨域问题,因为您是从服务器而不是浏览器加载数据”,所以是否有例如从浏览器加载数据的方法?

因此,正如 user868766 在他的回答中所建议的那样,我尝试了两种没有报告任何错误的 ini_set 方法,所以看起来脚本显然工作得很好。当我在 $html 上尝试 print_r() 方法时,它输出以下内容:

simple_html_dom Object ( [root] => simple_html_dom_node Object ( [nodetype] => 5 [tag] => root [attr] => Array ( ) [children] => Array ( ) [nodes] => Array ( ) [parent] => [_] => Array ( [0] => -1 [1] => 1 ) [dom:simple_html_dom_node:private] => simple_html_dom Object *RECURSION* ) [nodes] => Array ( [0] => simple_html_dom_node Object ( [nodetype] => 5 [tag] => root [attr] => Array ( ) [children] => Array ( ) [nodes] => Array ( ) [parent] => [_] => Array ( [0] => -1 [1] => 1 ) [dom:simple_html_dom_node:private] => simple_html_dom Object *RECURSION* ) ) [callback] => [lowercase] => 1 [pos:protected] => 0 [char:protected] => [size:protected] => 0 [cursor:protected] => 1 [parent:protected] => simple_html_dom_node Object ( [nodetype] => 5 [tag] => root [attr] => Array ( ) [children] => Array ( ) [nodes] => Array ( ) [parent] => [_] => Array ( [0] => -1 [1] => 1 ) [dom:simple_html_dom_node:private] => simple_html_dom Object *RECURSION* ) [token_blank:protected] => [token_equal:protected] => =/> [token_slash:protected] => /> [token_attr:protected] => > [self_closing_tags:protected] => Array ( [img] => 1 [br] => 1 [input] => 1 [meta] => 1 [link] => 1 [hr] => 1 [base] => 1 [embed] => 1 [spacer] => 1 ) [block_tags:protected] => Array ( [root] => 1 [body] => 1 [form] => 1 [div] => 1 [span] => 1 [table] => 1 ) [optional_closing_tags:protected] => Array ( [tr] => Array ( [tr] => 1 [td] => 1 [th] => 1 ) [th] => Array ( [th] => 1 ) [td] => Array ( [td] => 1 ) [li] => Array ( [li] => 1 ) [dt] => Array ( [dt] => 1 [dd] => 1 ) [dd] => Array ( [dd] => 1 [dt] => 1 ) [dl] => Array ( [dd] => 1 [dt] => 1 ) [p] => Array ( [p] => 1 ) [nobr] => Array ( [nobr] => 1 ) ) [doc:protected] => [noise:protected] => Array ( ) )
4

1 回答 1

0

您发布的代码对我来说很好用。

认为您可以尝试这些,将以下几行放在脚本顶部:

    ini_set('error_reporting', E_ALL);
    ini_set('display_errors', 1);

还要检查 $html 的 print_r

    print_r($html);

希望这有帮助。

于 2012-07-12T10:41:22.717 回答