http://www.tibia.com/community/?subtopic=characters&name=Nikla
在此链接中,人物简介的底部有一份死亡名单。如何“收集”日期信息?我不担心其余的,只担心每次死亡的日期。
我将使用 PHP 文件来完成此操作。
我看过这篇文章:如何在 PHP 中制作一个简单的爬虫? 我只是不知道从哪里开始。
谁能指出我正确的方向?
http://www.tibia.com/community/?subtopic=characters&name=Nikla
在此链接中,人物简介的底部有一份死亡名单。如何“收集”日期信息?我不担心其余的,只担心每次死亡的日期。
我将使用 PHP 文件来完成此操作。
我看过这篇文章:如何在 PHP 中制作一个简单的爬虫? 我只是不知道从哪里开始。
谁能指出我正确的方向?
您可以使用像Simple HTML DOM Parser这样的 DOM 解析。从 SourceForge 下载存档安装它,include
在你的脚本中的文件,然后使用它。
该网站的表格布局很丑,但您可以执行以下操作:
代码:
<?php
include('simple_html_dom.php');
$html = file_get_html('http://www.tibia.com/community/?subtopic=characters&name=Nikla');
$count = 0; //counter variable
foreach($html->find('//*[@id="characters"]/div[5]/div/div/table[3]/tbody/tr['.
$i.']') as $table) { //traverse through the table and get <td> content
echo $table."<br/>";
$count++;
}
?>
输出:
Character Deaths
Jul 11 2013, 08:08:11 CEST Killed at Level 36 by Cintyus and Seque Ladinho.
Jul 11 2013, 07:32:31 CEST Killed at Level 36 by Drunk Noongah and Rea Per.
Jul 09 2013, 22:05:42 CEST Killed at Level 35 by Evil Kris and Tensser.
Jun 29 2013, 20:25:27 CEST Killed at Level 27 by Knight Abron.
Jun 27 2013, 07:31:33 CEST Killed at Level 23 by Mysterioz Pandoria Knight.
Jun 14 2013, 23:52:14 CEST Died at Level 16 by a rotworm.
这只是一个让你开始的例子。你可以修改它并得到你想要的。
希望这可以帮助!