1

目前,我正在从特定域抓取我的网站的大量流量,我们在使用 htaccess 时遇到问题,因为它们没有传递 IP 地址。

因此,我想在 GA 中创建一个配置文件过滤器来阻止流量,但我有点困惑。

在 GA 的报告套件中,我想要的域只能在网络域维度中找到,但是在配置文件级别过滤器中,这不是一个选项,有谁知道最好使用的过滤器是什么

ISP 组织或 ISP 域,据我所知,这似乎是一个无证文件

干杯

约翰

4

3 回答 3

1

谷歌分析

当您在“管理”选项卡中时,使用 Web 过滤器过滤 Google Analytics 中的流量不会追溯。因此,任何已经发生的流量都不会从您当前的结果集中过滤掉。话虽如此,为了提高工作效率,您可以创建一个自定义报告,该报告不会基于一些事情显示来自机器人的任何流量。您可以使其排除特定的浏览器版本,例如:

exclude > Browser Version > Exact > BadBot

您还可以对 IP 范围使用自定义过滤器,甚至可以过滤来自特定国家/地区的流量或将流量限制在您自己的国家/地区(如果这是您的网站的目标)。

在 [web] 服务器本身上停止它

在保护 Web 服务器方面,适用相同的规则(例如,如果流量都是来自 的引荐流量badexample.com)。

RewriteCond %{HTTP_REFERER} ^badexample.com [NC]
RewriteRule .* - [F]

您可以使用拒绝指令在 Apache 中按 IP 范围阻止和反向域查找

Deny from 192.168.205
Deny from badexample.com
Deny from de 

您可以使用环境变量阻止它们

SetEnvIf User-Agent BadBot GoAway=1
Order allow,deny
Allow from all
Deny from env=GoAway  
于 2013-08-12T22:44:40.087 回答
1

ISP 域可以工作,您只需要知道要过滤掉的域即可。

您还可以设置自定义过滤器,而不使用预定义的过滤器,这样您就可以过滤掉主机名。

于 2013-08-12T17:10:25.983 回答
0

如果它是一个爬取你网站的机器人,你确定他们甚至在执行 JavaScript 吗?

所有请求都应该传递一个 IP 地址,尽管它可以是代理而不是实际源。

于 2013-08-12T17:24:08.137 回答