0

下面的脚本为所有机器人访问创建一个日志文件,向我发送一封电子邮件,并在 ip2location 验证 IP。它与带有 eregi 函数的 PHP5.2 一起工作得很好,所以我将 eregi 行修改为 preg_match 并在我的 wamp 测试服务器上工作了几分钟,因为我得到了一个“reg_match():分隔符不能是字母数字或反斜杠”警告,但现在它不起作用,也不会在 visit.log 文件中记录任何机器人。

脚本仍然在下面给了我这三个警告,但是由于它们是警告并且已经开始工作,所以我并没有太在意它们:

  • 注意:未定义的偏移量:第 28 行 C:\wamp\www\visits.php 中的 5
  • 警告:preg_match():第 28 行 C:\wamp\www\visits.php 中的空正则表达式
  • 注意:未定义索引:第 62 行 C:\wamp\www\visits.php 中的 js
<?php

error_reporting(E_ALL);
ini_set('display_errors', 1);

  $to = "email@here.com";

  $log = "./visits.log";

  $dateTime = date("r");


  $agents[] = "/googlebot/";
  $spiders[] = "/Google/";
  $spiders[] = "/Googlebot/";
  $agents[] = "/slurp/";
  $spiders[] = "/Slurp (Inktomi's robot, HotBot)/";
  $agents[] = "/msnbot/";
  $spiders[] = "/MSN Robot (MSN Search, search\.msn\.com)/";
  $agents[] = "/yahoo\! slurp/";
  $spiders[] = "/Yahoo! Slurp/";
  $agents[] = "/bingbot/";
  $spiders[] = "/Bing\.com/";
  $ip= $_SERVER['REMOTE_ADDR'];
  $found = false;

  for ($spi = 0; $spi < count($spiders); $spi++)
    if ($found = preg_match($agents[$spi], $_SERVER['HTTP_USER_AGENT']))
      break;

  if ($found) {
    $url = "http://" . $_SERVER['SERVER_NAME']. $_SERVER['PHP_SELF'];

    if ($_SERVER['QUERY_STRING'] != "") {
      $url .= '?' . $_SERVER['QUERY_STRING'];
    }

    $line = $dateTime . " " . $spiders[$spi] . " " . $ip." @ " . $url;
    $ip2location = "https://www.ip2location.com/".$_SERVER['REMOTE_ADDR'];

    if ($log != "") {
      if (@file_exists($log)) {
        $mode = "a";
      } else {
        $mode = "w";
      }

      if ($f = @fopen($log, $mode)) {
        @fwrite($f, $line . "\n");
        @fclose($f);
      }
    }

   if ($to != "") {
$to = "email@here.com";
$subject = $spiders[$spi]. " crawled your site";
$body = "$line". "\xA\xA" ."Whois verification available at: $ip2location";
mail($to, $subject, $body);
    }
  }

  if ($_REQUEST["js"]) {
     header("Content-Type: image/gif\r\n");
     header("Cache-Control: no-cache, must-revalidate\r\n");
     header("Pragma: no-cache\r\n");

     @readfile("visits.gif");
  }

?>
4

2 回答 2

0

括号在 php 7 preg_match 的正则表达式中有特殊的含义。只是逃避它们应该可以正常工作。至于第一个警告,而不是仅coint($agents)使用count($agents) - 1正弦数组索引从零开始或仅使用foreach. 第二次使用if(isset($_REQUEST ["js"]) 祝你好运

于 2020-01-27T03:53:52.613 回答
0

a)您在 $spiders 中有 6 个元素,在 $agents 中有 5 个元素,这会导致关于偏移量 5 和空正则表达式的警告。Googlebot 翻倍:

  $spiders[] = "/Google/";
  $spiders[] = "/Googlebot/";

删除一个条目

b)if ($_REQUEST["js"]) {应替换为:

if (isset($_REQUEST["js"])) {并根据您期望之后的值来检查 isset 值 - 例如,如果您验证true

if (isset($_REQUEST["js"]) && $_REQUEST['js'] === true) {

于 2020-01-27T03:58:54.457 回答