-2

当我在我的日志中看到一些 IP 滚动浏览我网站上的 100 多个页面时,我应该怎么做?我有一个 wordpress 博客,看起来这不是一个真实的人。这种情况几乎每天都会发生在不同的 IP 上。

更新:哦,我忘了提,我很确定它不是搜索引擎蜘蛛。主机名不是搜索引擎,而是来自印度的某个随机人(以“.in”结尾)。我关心的是,如果它是一个刮刀,我能做些什么吗?或者它可能比刮刀(例如黑客)更糟糕?

4

4 回答 4

4

这是一个蜘蛛/爬虫。搜索引擎使用它们来编译他们的列表,研究人员使用它们来弄清楚互联网的结构,互联网档案馆使用它们来为后代下载互联网内容,垃圾邮件发送者使用它们来搜索电子邮件地址,以及许多更多这样的情况。

查看日志中的用户代理字符串可能会为您提供有关他们正在做什么的更多信息。行为良好的机器人通常会表明他们是谁/他们是什么——例如,谷歌的搜索机器人被称为 Googlebot。

于 2009-05-28T03:55:32.713 回答
2

如果您担心脚本小子,我建议检查您的错误日志。脚本通常会寻找您可能没有的东西;例如,在我运行的一个系统上,我没有 ASP,但是,我可以知道脚本小子何时探测了该站点,因为我在错误日志中看到很多尝试查找 ASP 页面的尝试。

于 2009-05-28T04:37:29.120 回答
0

可能是一些脚本小子想要利用您博客(或服务器)中的漏洞。那个,或者一些网络爬虫。

于 2009-05-28T03:54:49.733 回答
0

它可能是一个蜘蛛机器人索引您的网站。“用户代理”可能会放弃它。如果动态生成的 Wordpress 网站不是所有的博客页面而是包含诸如 css、js 和图像之类的东西,那么它可能很容易有 100 多个 GET 请求。

于 2009-05-28T03:59:08.040 回答