2

我正在尝试从一个页面读取链接,打印 URL,转到该页面,然后在同一位置读取下一页上的链接,打印 url,转到该页面(等等......)。

我所做的只是读取 URL 并将其作为参数传递给get_links()函数,直到没有更多链接为止。

这是我的代码,但它抛出:

Fatal error: Call to a member function find() on a non-object. 

有人知道怎么修这个东西吗?

  <?php
$mainPage = 'https://www.bu.edu/link/bin/uiscgi_studentlink.pl/1346752597?ModuleName=univschr.pl&SearchOptionDesc=Class+Subject&SearchOptionCd=C&KeySem=20133&ViewSem=Fall+2012&Subject=&MtgDay=&MtgTime=';

get_links($mainPage);

function get_links($url) {
    $data = new simple_html_dom();
    $data = file_get_html($url);

    $nodes = $data->find("input[type=hidden]");
    $fURL = $data->find("/html/body/form");
    $firstPart = $fURL[0]->action . '<br>';

    foreach ($nodes as $node) {
        $val = $node->value;
        $name = $node->name;
        $name . '<br />';
        $val . "<br />";

        $str1 = $str1 . "&" . $name . "=" . $val;
    }
    $fixStr1 = str_replace('&College', '?College', $str1);
    $fixStr2 = str_replace('Fall 2012', 'Fall+2012', $fixStr1);
    $fixStr3 = str_replace('Class Subject', 'Class+Subject', $fixStr2);

    $fixStr4 = $firstPart . $fixStr3;
    echo $nextPageURL = chop($fixStr4);
    get_links($nextPageURL);
}
?>
4

1 回答 1

0

好吧,所以我load->file()在我的代码中的某个地方使用了该函数,直到我真正通过它才看到它。终于有了一个运行脚本 :) 关键是使用函数来file_get_html代替加载网页作为对象load->file()

于 2012-09-10T09:39:07.187 回答