我在我的日志中得到了很多网络点击,这些点击爬取了我网站的大多数顶级页面,并将引荐来源显示为 Java 版本。
我在引用者中看到了 Java 版本的不同变体,即 Java/1.6.0_04、Java/1.4.1_04、Java/1.7.0_25 等。
有时,但并非总是如此,我得到 /contact/ 的 404,但下面的其他页面都没有。
根据蜜罐项目的说法,IP 通常总是垃圾邮件收割机和机器人
78.129.252.190 - - [24/Jan/2014:01:28:52 -0800] "GET / HTTP/1.1" 200 6728 "-" "Java/1.6.0_04" 198 7082
78.129.252.190 - - [24/Jan/2014:01:28:55 -0800] "GET /about HTTP/1.1" 301 - "-" "Java/1.6.0_04" 203 352
78.129.252.190 - - [24/Jan/2014:01:28:55 -0800] "GET /about/ HTTP/1.1" 200 29933 "-" "Java/1.6.0_04" 204 30330
78.129.252.190 - - [24/Jan/2014:01:28:56 -0800] "GET /articles-columns HTTP/1.1" 301 - "-" "Java/1.6.0_04" 214 363
78.129.252.190 - - [24/Jan/2014:01:28:57 -0800] "GET /articles-columns/ HTTP/1.1" 200 29973 "-" "Java/1.6.0_04" 215 30370
78.129.252.190 - - [24/Jan/2014:01:28:58 -0800] "GET /contact HTTP/1.1" 301 - "-" "Java/1.6.0_04" 205 354
78.129.252.190 - - [24/Jan/2014:01:28:58 -0800] "GET /contact/ HTTP/1.1" 200 47424 "-" "Java/1.6.0_04" 206 47827
他们在找什么?漏洞?
我可以通过他们的 Java 推荐人阻止这些访问吗?如果是这样,怎么做?用php函数?
还是我应该通过 IP 阻止它们?(我知道如何在 .htaccess 中执行此操作,但这是一种不太主动的方法)。