下面的脚本为所有机器人访问创建一个日志文件,向我发送一封电子邮件,并在 ip2location 验证 IP。它与带有 eregi 函数的 PHP5.2 一起工作得很好,所以我将 eregi 行修改为 preg_match 并在我的 wamp 测试服务器上工作了几分钟,因为我得到了一个“reg_match():分隔符不能是字母数字或反斜杠”警告,但现在它不起作用,也不会在 visit.log 文件中记录任何机器人。
脚本仍然在下面给了我这三个警告,但是由于它们是警告并且已经开始工作,所以我并没有太在意它们:
- 注意:未定义的偏移量:第 28 行 C:\wamp\www\visits.php 中的 5
- 警告:preg_match():第 28 行 C:\wamp\www\visits.php 中的空正则表达式
- 注意:未定义索引:第 62 行 C:\wamp\www\visits.php 中的 js
<?php
error_reporting(E_ALL);
ini_set('display_errors', 1);
$to = "email@here.com";
$log = "./visits.log";
$dateTime = date("r");
$agents[] = "/googlebot/";
$spiders[] = "/Google/";
$spiders[] = "/Googlebot/";
$agents[] = "/slurp/";
$spiders[] = "/Slurp (Inktomi's robot, HotBot)/";
$agents[] = "/msnbot/";
$spiders[] = "/MSN Robot (MSN Search, search\.msn\.com)/";
$agents[] = "/yahoo\! slurp/";
$spiders[] = "/Yahoo! Slurp/";
$agents[] = "/bingbot/";
$spiders[] = "/Bing\.com/";
$ip= $_SERVER['REMOTE_ADDR'];
$found = false;
for ($spi = 0; $spi < count($spiders); $spi++)
if ($found = preg_match($agents[$spi], $_SERVER['HTTP_USER_AGENT']))
break;
if ($found) {
$url = "http://" . $_SERVER['SERVER_NAME']. $_SERVER['PHP_SELF'];
if ($_SERVER['QUERY_STRING'] != "") {
$url .= '?' . $_SERVER['QUERY_STRING'];
}
$line = $dateTime . " " . $spiders[$spi] . " " . $ip." @ " . $url;
$ip2location = "https://www.ip2location.com/".$_SERVER['REMOTE_ADDR'];
if ($log != "") {
if (@file_exists($log)) {
$mode = "a";
} else {
$mode = "w";
}
if ($f = @fopen($log, $mode)) {
@fwrite($f, $line . "\n");
@fclose($f);
}
}
if ($to != "") {
$to = "email@here.com";
$subject = $spiders[$spi]. " crawled your site";
$body = "$line". "\xA\xA" ."Whois verification available at: $ip2location";
mail($to, $subject, $body);
}
}
if ($_REQUEST["js"]) {
header("Content-Type: image/gif\r\n");
header("Cache-Control: no-cache, must-revalidate\r\n");
header("Pragma: no-cache\r\n");
@readfile("visits.gif");
}
?>