3

我尝试使用三种不同的方法提取某个目录的(唯一)访问者计数: * 使用配置文件 * 使用动态高级细分 * 使用自定义报告过滤器

在较小的站点上,这三种方法给出了相同的结果。但是在大型网站(> 5M 访问/月)上,一方面我的个人资料与另一方面的高级细分和过滤器之间存在很大差异。这可能是因为抽样 - 但在综合浏览量方面差异较小。使用抽样数据时,访问者的估计是否更差,差异更大?此外,当从 API 中提取数据(使用过滤器或配置文件)时,即使 GA 没有表明数据是经过采样的,我仍然会得到不同的数据 - 即我正在查看未采样的数据。

另一个奇怪的事情是,配置文件中的综合浏览量高于过滤器,而过滤器的访问者数量高于配置文件。我还在配置文件中应用了一个过滤器以强制它使用样本数据 - 我再次得到与过滤器和分段数据非常相似的结果。

           profile  filter  segment  filter@profile
unique     25550    37778   36433    37971 
pageviews  202761   184130  n/a      202761

我想要实现的是找到一种方法,当我用完个人资料时,可以获取有关唯一访问者的准确数据。

更多有差异的数据可以在这个谷歌文档中找到:https ://docs.google.com/spreadsheet/ccc?key=0Aqzq0UJQNY0XdG1DRFpaeWJveWhhdXZRemRlZ3pFb0E

4

2 回答 2

4

Google Analytics(免费版)每月仅跟踪 10 次 mio 页面交互 [0](浏览量和事件,任何以“track”开头的跟踪器方法都是交互)[1],因此您的大型网站的数据可能已经很庞大抽样(我猜你们 500 万访问者中的每个人都有两个以上的互动)[2]。临时报告最多仅使用 1 个 mio 数据点,因此您有一个样本样本。自然聚合值受较小样本量的影响更大。

而且我很确定数据限制也适用于 api 访问(谷歌表示“无法保证会处理多余的命中”),因此对于大型站点,api 也会返回采样(或不完整)数据 -所以你不能真正查看非抽样数据。

至于差异,我想说不同的临时报告使用不同的样本,所以你最终会得到不同的结果。使用 GA,您无论如何都不应该过于依赖绝对数字,而应该更多地寻找总体趋势。

[1] Analytics Premium 每月跟踪 50 次 mio 交互(并得到 Google 的支持),但每年的费用为 150 000 美元

[2] Google 建议在大型网站上使用“_setSampleRate()”,以确保您对每月每一天的数据进行了实际采样,而不是在超出数据限制后随机命中或未命中。


数据限制:

http://support.google.com/analytics/bin/answer.py?hl=en&answer=1070983)。

设置采样率:

https://developers.google.com/analytics/devguides/collection/gajs/methods/gaJSApiBasicConfiguration#_gat.GA_Tracker_._setSampleRate

于 2012-11-08T16:32:43.150 回答
1

是的,抽样数据不太准确,尤其是访客人数。

我还看到他们在两天内错过了 50 万次综合浏览量,但几天后才看到他们出现在他们的报告中。从不同的界面看到不同的结果也不足为奇。谷歌分析的质量已经下降,即使他们试图变得更加实时。看起来他们的代码库在 API 之间是不一致的,而且他们的算法到处都是。

我通常坚持使用相同的指标和报告方法,以便我的结果保持可比性。我还与 Gaug.es 一起运行 GA,作为验证和完整性检查。有了这些额外的数据,我选择了我最有信心的 GA 报告方法,并且我完全依赖它。

于 2012-11-08T05:22:29.950 回答