0

上有一个日历:http ://www.friendsbalt.org/upper/stulife/calendar.asp以静态表的形式,我想让服务器抓取并逐行解析出表。这可能吗?您将如何以最有效的方式做到这一点?代码示例将是惊人的。

4

1 回答 1

7

如果您希望它由网页完成,您可以使用类似Simple HTML DOM for php 之类的东西。

require "simple_html_dom.php"; //Get this file from the link above
$html = file_get_html("http://example.com");
$data = array();
foreach($html->find("table tr") as $tr){
    $row = array();
    foreach($tr->find("td") as $td){
        /* enter code here */
        $row[] = $td->plaintext;
    }
    $data[] = $row;
}

然后所有数据都将在 $data 变量中。

var_dump($data); //To prove it works.

我会考虑将其放入“刷新”脚本中,并将所有信息保存到数据库中。然后你可以从数据库中获取信息——这几乎是即时的。

然后,如果你愿意,你可以制作一个 cron 脚本,让它每小时运行一次——更新数据库,使其中的信息保持最新。

这真的取决于你想用它做什么:)

于 2012-09-13T03:23:04.310 回答