我正在为我的下一个任务收集有关网络分析工具(如谷歌网络分析)的信息,但我找不到任何好的信息。我在寻找:
- 使用的关键术语。
- 哪些媒介可用于数据收集以及它们是如何工作的。
- 任何参考书、白皮书等(技术和非技术)。
- 任何开源实现(尤其是在 .NET 中)。
我正在为我的下一个任务收集有关网络分析工具(如谷歌网络分析)的信息,但我找不到任何好的信息。我在寻找:
以下是使用的关键术语:
使用方法:
Web 服务器日志文件分析
在这种方法中,您编写脚本以从日志文件中刮取详细信息,然后将其写入数据库。此方法不会为您提供实时统计信息。您可以在此处阅读有关网络日志分析软件的更多信息。
页面标记
添加 javascript 代码或仅添加图像,然后使用该代码获取有关页面、referrr、访问者等的所有详细信息。
...这些是包含在网页中的图像,显示了图像被请求的次数,这是对该页面访问次数的估计。在 1990 年代后期,这一概念演变为包括一个小的不可见图像而不是可见图像,并且通过使用 JavaScript,与图像请求一起传递有关页面和访问者的某些信息。然后,这些信息可以由网络分析公司远程处理,并生成大量统计数据......
如果您在自己的网站中使用分析,则可以使用Eytan Levit 提供的代码
信用维基百科。可以在那里找到更多信息。
好,
我不是专家,但您可以检索以下一些常见数据来构建您自己的分析:
string str;
str += "Refferer:" + Request.UrlReferrer.AbsolutePath.ToString() + "<BR>";
str += "Form data:" + Request.Form.ToString() + "<br>";
str += "User Agent:" + Request.ServerVariables["HTTP_USER_AGENT"] + "<br>";
str += "IP Address:" + Request.UserHostAddress.ToString() + "<BR>";
str += "Browser:" + Request.Browser.Browser + " Version: " + Request.Browser.Version + " Platform: " + Request.Browser.Platform + "<BR>";
str += "Is Crawler: " + Request.Browser.Crawler.ToString() + "<BR>";
str += "QueryString" + Request.QueryString.ToString() + "<BR>";
您还可以解析用户访问您网站的关键字,如下所示:
protected string GetKeywordFromReferrer(string url)
{
if (url.Trim() == "")
{
return "no url";
}
string urlEscaped = Uri.UnescapeDataString(url).Replace('+', ' ');
string terms = "";
string site = "";
Match searchQuery = Regex.Match(urlEscaped, @"[\&\?][qp]\=([^\&]*)");
if (searchQuery.Success)
{
terms = searchQuery.Groups[1].Value;
}
else
{
Match siteDomain = Regex.Match(urlEscaped, @"http\:\/\/(.+?)\/");
if (siteDomain.Success)
{
site = siteDomain.Groups[1].Value;
}
}
if (terms != "")
{
return terms;
}
if (site != "")
{
return site;
}
return "Direct Access";
}
希望这有所帮助。
1. 使用的关键术语
与答案 1相同
2. 哪些媒介可用于数据收集以及它们是如何工作的。
来自 Apache、IIS 的日志文件。ASP.NET 或您的实际页面的 HTTP 处理程序。Javascript 包括(Javascript 可用的对象为您提供有关客户端所需的大部分信息)
3. 任何参考书、白皮书等(技术和非技术)
HTTP 上的 RFC 很有用,它为您提供了大部分可捕获的请求标头。
4.任何开源实现(尤其是.NET)。
我写了一个已经完成分析的解析部分(在我看来是最难的部分)。由于它已有 4 年历史,因此需要在某些领域进行一些调整:
它缺少 DAL,这比听起来更难 - 主要障碍是确保您不会复制日志每一行所具有的确切数据,因为您也可以只使用日志文件。另一部分是以一种很好的格式显示这些聚合数据。我的目标是将它存储在 SQL Server 和 db4o 格式中以适应较小的网站。
Statmagic 项目的“可悲”部分是 Google 出现并彻底消灭了竞争对手以及我完成它的任何一点。