问题标签 [web-analytics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2369 浏览

google-analytics - 为 Google Analytics 和 Omniture 生成链接

我正在尝试为 Google Analytics 和 Omniture 构建 URL。

GA 很简单,可以使用http://www.google.com/support/analytics/bin/answer.py?hl=en&answer=55578构建这些 URL

有谁知道 Omniture 链接是如何构建的?他们支持这种网址吗?

0 投票
1 回答
381 浏览

java - 解析 html 页面并将内容(标题、文本等)存储到数据库中

有人知道一些开源工具来解析 html 页面、过滤广告、JS 等以获取标题、文本。我的应用程序的前端基于 LAMP。所以我需要解析html页面并将它们存储到Mysql中。并用这些数据填充首页。

我知道一些工具:Heritrix、Nutch。但似乎它们是爬虫。

谢谢。约瑟夫

0 投票
1 回答
469 浏览

web-analytics - 跟踪访问/来源 asp.net mvc 网站

我不确定这是否可行,我之前肯定从未尝试过这样做,但我有一位客户希望能够知道某人在访问该网站时来自哪里。是来自 google、bing、来自另一个网站的链接等。更重要的是,他们还想知道访问是正常 SSO 的产物还是像 adwords 这样的付费添加?

我会很感激任何人对此的想法,如果可能的话?

非常感谢

0 投票
1 回答
1524 浏览

python - 从 Web 服务器日志中计算用户会话的免费实现?

Web 服务器日志分析器(例如 Urchin)通常会显示许多“会话”。会话定义为个人在有限的连续时间段内进行的一系列页面访问/点击。尝试使用 IP 地址来识别这些段,通常是用户代理和操作系统等补充信息,以及会话超时阈值,如 15 或 30 分钟。

对于某些网站和应用程序,可以使用 cookie 登录和/或跟踪用户,这意味着服务器可以准确地知道会话何时开始。我不是在谈论这个,而是在网络服务器不跟踪它们时启发式地推断会话(“会话重建”)。

我可以编写一些代码,例如在 Python 中尝试根据上述标准重建会话,但我宁愿不重新发明轮子。我正在查看大小约为 400K 行的日志文件,因此我必须小心使用可扩展的算法。

我的目标是从日志文件中提取唯一 IP 地址列表,并为每个 IP 地址从该日志中推断出会话数。绝对精度和准确性不是必需的……相当好的估计是可以的。

基于此描述

如果两个条件有效,则将新请求放入现有会话中:

  • IP 地址和用户代理与会话中已
    插入的请求相同,
  • 该请求在插入最后一个请求后不到 15 分钟完成。

从理论上讲,编写一个 Python 程序来构建一个字典(由 IP 键入)是一个简单的字典(由用户代理键入),其值是一对:(会话数,最新会话的最新请求)。

但如果有可用的实现,我宁愿尝试使用现有的实现,否则我可能会冒着花费大量时间调整性能的风险。

仅供参考,以免有人要求输入示例,这是我们的日志文件的一行(已清理):

0 投票
1 回答
179 浏览

apache - 是否有可以理解处理时间和解析查询字符串的网络日志分析器?

有谁知道一个 Web 日志分析器,它既可以报告 Apache 可以存储的“处理时间”字段(%D),又可以智能地解析查询字符串?

我研究了一些常见的嫌疑人,例如 AWStats 和 Webalyser,但我看过的似乎都没有提供这些功能中的任何一个。

理想情况下,您将能够报告特定的查询字符串参数而不是简单的“页面”请求,例如,如果我的服务器显示命中:

/someurl?blah=X&whatever=Y

/someurl?whatever=Y&blah=Z

我希望它能够智能地解析它,所以如果我要求一个报告,其中“whatever=Y”两个 URL 将被分组在一起,而如果我报告“blah=X”,它们将被单独计算?

任何可以做到这一点的现成工具的建议?FOSS 或其他。

是的,我意识到我可以自己编写一些 awk 或 sed 脚本来解析这类事情,但我正在寻找有人为我完成了这项艰苦的工作,并将其呈现在一个漂亮的图表中,或者你有什么。

0 投票
1 回答
882 浏览

google-analytics - 不清楚 Google Analytics API 配额限制

我最近一直在修复我的应用程序,该应用程序显然达到了一些 GA 配额限制,并且我发现了一些我不清楚的事情:

  • 4 个并发请求限制是否适用于每个应用程序、每个 Web 资源或其他任何内容?
  • 如果我们在任何给定的 1 秒时间段内中断 10 个请求4 个并发请求限制,那么在 GA 停止响应 503 ServiceUnavailable 错误之前需要多长时间?
  • 每个应用程序的配额是否仅指应用程序名称字符串?我们正在使用不同的 GA 应用程序字符串运行两个不同的 Web 应用程序。两个应用程序都从同一个 IP 地址连接 GA API。在这种情况下,我们可以期望每个应用程序的配额是针对每个应用程序字符串分别计算的吗?
  • 与 503 ServiceUnavailable 响应一起发送的状态代码是否记录在任何地方?我们能否确定rateLimitExceeded指的是每秒 10 个请求的限制?如何找出 503 响应的原因?

顺便说一句,比记录的更严格的配额限制有时可能会生效吗?

例如,GA 是否有可能在 6 个快速但随后的请求之后回复 503 ServiceUnavailable 响应,或者仅仅是因为文档中未包含的客户端应用程序的任何其他不良行为?

问候,

帕维尔

0 投票
2 回答
2533 浏览

javascript - 如何使用 Google Analytics 或 Yahoo Web Analytics 跟踪对 Facebook 页面的访问?

我最近对此进行了调查,发现在 facebook 粉丝页面中使用 FBML 页面,我可以添加 fb:google-analytics 标签或图像标签来跟踪页面访问。但是,我没有发现任何方法可以跟踪对其他 facebook 标签页的访问,例如“图片”或“墙”。

有没有办法做到这一点?

谢谢

0 投票
2 回答
201 浏览

web-analytics - 网站分析 - 如何?

我一直在考虑将分析添加到我构建的 CMS 系统中。我不打算使用第 3 方包或服务。我真的很想按访问者和时间记录页面访问。

我不是想确定一个人或跟踪单个站点之外的人。我想知道访客是否与昨天相同。

我正在考虑一个存储时间、页面 ID 和访问者哈希(md5 或其他东西)的简单表。这会让我说“访问者 X 每 5 天访问该站点”类型的事情,并且能够说访问者 Y 从第 1 页到第 2 页到第 14 页又回到第 1 页以及其他统计信息。

我可以轻松获得时间和页面 ID,即访问者 ID。我可以获取 IP,但是通过该站点跟踪一次访问。它不能可靠地用于跟踪回访。NAT 一个 DHCP 使使用 IP 不受欢迎 - 我认为。我想我可以使用客户端 cookie,但我宁愿不使用。

是否有可靠的或比 IP 更可靠的方法来识别回访者?

0 投票
2 回答
4468 浏览

google-analytics - 谷歌分析和实时分析比较:Chartbeat vs Clicky vs Mixpanel

我们很想听听有关 Chartbeat、Clicky、Mixpanel 和 Google Analytics 的意见和经验。

人们是否部署了谷歌和其他实时系统之一?还是实时系统足以取代谷歌?

在实时系统中,您使用哪些,为什么?

谢谢!

0 投票
5 回答
10328 浏览

javascript - 如何跟踪外部链接被点击的次数?

我有一个附属于一所大学的网站,我们想链接到另一个有特定教学计划的网站。

我们如何跟踪从我们网站内点击此链接的次数?