对于准确的 Web 日志分析工具以生成 IIS 日志报告有什么建议吗?我们使用了 WebTrends,但我觉得它并不准确。
8 回答
分析博客,我不认为Analog会出错:http ://www.analog.cx/
如果您正在分析自己的日志(通常是巨大的文件),您将需要您能找到的最快的分析器。模拟速度很快。
你会想要一个已经存在一段时间并且仍然受支持的。Analog刚刚庆祝了它的10岁生日。
Analog声称是世界上最流行的日志文件分析器。
多种语言。
我说它是免费和开源的吗?
就准确性而言,没有任何工具可以提供完美的结果。Javascript 在捕获命中时经常失败。试图通过网站跟踪个人的路径(即出于分析目的)充满了问题。甚至试图区分点击量和访问量并筛选出机器人,这更像是一门黑色艺术而不是一门科学。
最好的办法就是拥有一个工具,它可以提供体面的基本统计数据,告诉你你需要知道什么。
我查看了其他工具,例如 Deep Log Analyzer: http: //www.deep-software.com/,它试图从您的博客中进行分析。但是速度是个问题。他们声称他们的新版本 3.5 - 2008 年 4 月(我没有尝试过)提高了性能。像这样的程序的一大优势是您可以执行高级报告,包括自定义 SQL 请求。您必须购买他们的专业版(200 美元)才能进行大部分分析和自定义查询。如果 Analog 对您来说太简单了,那么试试 Deep Log Analyzer 的免费版本。
你也可以试试微软自己的日志解析器,推荐的答案是:https ://stackoverflow.com/questions/157677/a-good-iis-log-viewer-for-large-log-files 。但是你需要一些额外的技能才能使用它。
简短的回答:
你对结果的质疑是正确的;日志分析不足以报告实际流量。
更长的答案:
WebTrends 是一个伟大的工具,它提供了什么。但作为 WebTrends 安装的前任管理员,我发现 Web 日志在捕获感兴趣的指标方面是出了名的糟糕。
例如,如果您的 Web 交付堆栈中存在任何缓存(或在消费者方面 - *我在向您挥舞拳头,AOL!),那么您的 Web 日志将立即不反映您网站的实际活动。这是因为日志分析假定所有用户消费都将转换为返回 Web 服务器的 HTTP 请求,因此已记录在 IIS 日志中。在缓存的情况下,情况并非如此。
将来,如果您想要更可靠的结果,您最终需要确保存在一种方法来破坏任何缓存策略。显而易见的答案是动态内容。但是,如果您不想以这种方式重写所有内容,只需确保您的网络流量分析使用动态调用。
WebTrends 实际上为这个问题提供了一个解决方案,称为 SDC 服务器。这正是谷歌分析所提供的——它是一个对分析服务器的 javascript 回调。
...我可以在这上面呆几天。如果您想了解更多具体信息,请回复评论。;)
编辑:特别是使用 WebTrends,在默认 IP/userAgent 配置之外配置会话跟踪非常重要。如果您的网络服务器分配了会话 cookie,您会发现这会增加您的可靠性;特别是用于区分可能位于同一 NAT 后面的用户。
您想从日志中分析什么?有一堆工具 - 免费或付费 - 将通过日志并吐出各种各样的数字。有些具有真正的意义,有些则最好与一粒盐一起使用。
没有人会告诉你“有多少人真正在阅读我精彩的网页”。那些试图显示“不同的网站访问者”或任何详细指标的人充其量只是对模糊趋势的粗略近似......
但是对于它的价值,我们使用Analog。
来自SmarterTools的 SmarterStats 让我非常幸运。
MSFT 提供了一个免费的日志记录包,用于使用 SQL Reporting Services 查看此信息。去谷歌上查询。
如果它是内部的,那么使用日志只是一个好主意 - 我会使用谷歌分析来处理互联网上的任何事情
多年来,我一直在使用为软件付费的 Summary,并且喜欢它。更新的成本对我来说很重要,而支付更新以从交易中获取用户代理字符串更新变得越来越麻烦。并不是说没有其他修复,我只是倾向于不需要它们。
如果他们使用摘要与模拟相比,有人愿意分享吗?
看看 XpoLog 日志分析平台的 web 应用服务器和 web 服务器日志。它是一个日志管理和分析平台,可集成到 Web 服务器日志并创建报告,提供搜索和日志查看器以及监控问题。XpoLog