目前,我正在从特定域抓取我的网站的大量流量,我们在使用 htaccess 时遇到问题,因为它们没有传递 IP 地址。
因此,我想在 GA 中创建一个配置文件过滤器来阻止流量,但我有点困惑。
在 GA 的报告套件中,我想要的域只能在网络域维度中找到,但是在配置文件级别过滤器中,这不是一个选项,有谁知道最好使用的过滤器是什么
ISP 组织或 ISP 域,据我所知,这似乎是一个无证文件
干杯
约翰
目前,我正在从特定域抓取我的网站的大量流量,我们在使用 htaccess 时遇到问题,因为它们没有传递 IP 地址。
因此,我想在 GA 中创建一个配置文件过滤器来阻止流量,但我有点困惑。
在 GA 的报告套件中,我想要的域只能在网络域维度中找到,但是在配置文件级别过滤器中,这不是一个选项,有谁知道最好使用的过滤器是什么
ISP 组织或 ISP 域,据我所知,这似乎是一个无证文件
干杯
约翰
谷歌分析
当您在“管理”选项卡中时,使用 Web 过滤器过滤 Google Analytics 中的流量不会追溯。因此,任何已经发生的流量都不会从您当前的结果集中过滤掉。话虽如此,为了提高工作效率,您可以创建一个自定义报告,该报告不会基于一些事情显示来自机器人的任何流量。您可以使其排除特定的浏览器版本,例如:
exclude > Browser Version > Exact > BadBot
您还可以对 IP 范围使用自定义过滤器,甚至可以过滤来自特定国家/地区的流量或将流量限制在您自己的国家/地区(如果这是您的网站的目标)。
在 [web] 服务器本身上停止它
在保护 Web 服务器方面,适用相同的规则(例如,如果流量都是来自 的引荐流量badexample.com
)。
RewriteCond %{HTTP_REFERER} ^badexample.com [NC]
RewriteRule .* - [F]
您可以使用拒绝指令在 Apache 中按 IP 范围阻止和反向域查找。
Deny from 192.168.205
Deny from badexample.com
Deny from de
您可以使用环境变量阻止它们:
SetEnvIf User-Agent BadBot GoAway=1
Order allow,deny
Allow from all
Deny from env=GoAway
ISP 域可以工作,您只需要知道要过滤掉的域即可。
您还可以设置自定义过滤器,而不使用预定义的过滤器,这样您就可以过滤掉主机名。
如果它是一个爬取你网站的机器人,你确定他们甚至在执行 JavaScript 吗?
所有请求都应该传递一个 IP 地址,尽管它可以是代理而不是实际源。