4

我正在为我的下一个任务收集有关网络分析工具(如谷歌网络分析)的信息,但我找不到任何好的信息。我在寻找:

  1. 使用的关键术语。
  2. 哪些媒介可用于数据收集以及它们是如何工作的。
  3. 任何参考书、白皮书等(技术和非技术)。
  4. 任何开源实现(尤其是在 .NET 中)。
4

3 回答 3

7

以下是使用的关键术语

  • 命中(互联网)
  • 页面预览
  • 参观/会议
  • 第一次访问/第一次会议
  • 访客/唯一访客/唯一用户
  • 重复访客
  • 新访客
  • 印象
  • 单身人士
  • 跳出率
  • % 出口
  • 可见时间
  • 会话持续时间
  • 页面浏览时长/页面停留时间
  • 每个会话的页面深度/页面浏览量
  • 每个唯一身份的频率/会话
  • 点击路径

使用方法

  • Web 服务器日志文件分析
  • 页面标记

Web 服务器日志文件分析

在这种方法中,您编写脚本以从日志文件中刮取详细信息,然后将其写入数据库。此方法不会为您提供实时统计信息。您可以在此处阅读有关网络日志分析软件的更多信息。

页面标记

添加 javascript 代码或仅添加图像,然后使用该代码获取有关页面、referrr、访问者等的所有详细信息。

...这些是包含在网页中的图像,显​​示了图像被请求的次数,这是对该页面访问次数的估计。在 1990 年代后期,这一概念演变为包括一个小的不可见图像而不是可见图像,并且通过使用 JavaScript,与图像请求一起传递有关页面和访问者的某些信息。然后,这些信息可以由网络分析公司远程处理,并生成大量统计数据......

如果您在自己的网站中使用分析,则可以使用Eytan Levit 提供的代码

信用维基百科。可以在那里找到更多信息。

于 2009-02-04T07:25:14.173 回答
4

好,

我不是专家,但您可以检索以下一些常见数据来构建您自己的分析:

string str;
str += "Refferer:" + Request.UrlReferrer.AbsolutePath.ToString() + "<BR>";
str += "Form data:" + Request.Form.ToString() + "<br>";
str += "User Agent:" + Request.ServerVariables["HTTP_USER_AGENT"] + "<br>";
str += "IP Address:" + Request.UserHostAddress.ToString() + "<BR>";
str += "Browser:" + Request.Browser.Browser + " Version: " + Request.Browser.Version + " Platform: " + Request.Browser.Platform + "<BR>";
str += "Is Crawler: " + Request.Browser.Crawler.ToString() + "<BR>";
str += "QueryString" + Request.QueryString.ToString() + "<BR>";

您还可以解析用户访问您网站的关键字,如下所示:

protected string GetKeywordFromReferrer(string url)
{
    if (url.Trim() == "")
    {
        return "no url";
    }
    string urlEscaped = Uri.UnescapeDataString(url).Replace('+', ' ');
    string terms = "";
    string site = "";

    Match searchQuery = Regex.Match(urlEscaped, @"[\&\?][qp]\=([^\&]*)");
    if (searchQuery.Success)
    {
        terms = searchQuery.Groups[1].Value;
    }
    else
    {
        Match siteDomain = Regex.Match(urlEscaped, @"http\:\/\/(.+?)\/");
        if (siteDomain.Success)
        {
            site = siteDomain.Groups[1].Value;
        }
    }
    if (terms != "")
    {
        return terms;
    }
    if (site != "")
    {
        return site;
    }

    return "Direct Access";

}

希望这有所帮助。

于 2009-02-04T07:30:20.420 回答
2

1. 使用的关键术语
与答案 1相同

2. 哪些媒介可用于数据收集以及它们是如何工作的。
来自 Apache、IIS 的日志文件。ASP.NET 或您的实际页面的 HTTP 处理程序。Javascript 包括(Javascript 可用的对象为您提供有关客户端所需的大部分信息)

3. 任何参考书、白皮书等(技术和非技术)
HTTP 上的 RFC 很有用,它为您提供了大部分可捕获的请求标头。

4.任何开源实现(尤其是.NET)。

我写了一个已经完成分析的解析部分(在我看来是最难的部分)。由于它已有 4 年历史,因此需要在某些领域进行一些调整:

它缺少 DAL,这比听起来更难 - 主要障碍是确保您不会复制日志每一行所具有的确切数据,因为您也可以只使用日志文件。另一部分是以一种很好的格式显示这些聚合数据。我的目标是将它存储在 SQL Server 和 db4o 格式中以适应较小的网站。

Statmagic 项目的“可悲”部分是 Google 出现并彻底消灭了竞争对手以及我完成它的任何一点。

于 2009-03-11T22:45:33.017 回答