0

就在一个小时前,我启动了tailingapache 日志文件(访问日志),从那以后,我注意到了这个奇怪的用户代理,(在 Google 的官方文档中找不到它)。

我对此感到怀疑,因为我在 Google 的网站上找不到有关此用户代理的任何信息,

("Mozilla/5.0 (compatible; GoogleApps script; +http://script.google.com/bot.html))

它每天每分钟都在爬取我们网站的登录页面。

这是日志片段:

72.14.199.55 - - [07/Aug/2013:16:06:28 +0000] "GET / HTTP/1.1" 302 639 "-" "Mozilla/5.0 (compatible; GoogleApps script; +http://script.google.com/bot.html)"

72.14.199.55 - - [07/Aug/2013:16:06:28 +0000] "GET /accounts/login/ HTTP/1.1" 200 3780 "-" "Mozilla/5.0 (compatible; GoogleApps script; +http://script.google.com/bot.html)"

而且一直是同一个IP。它仍然是,

这种爬行模式常见吗?

4

1 回答 1

4

Google Apps 脚本允许用户编写基于 JavaScript 的代码并将它们设置为在 Google 服务器上以指定的时间间隔运行。

这不是谷歌的网络爬虫,它是谷歌用户编写的脚本。

另外:如果您阻止 IP 或其他任何内容,Google 用户可能每分钟都会收到“您的脚本运行失败”电子邮件的轰炸。

于 2013-09-12T15:40:37.853 回答