4

这可能是一个相当高级的问题,需要大量解释,但我需要大量解释。

基本上我正在开发一个需要大量日志记录和跟踪的 PHP 应用程序。跟踪点击、交互、性能等。阳光下的任何东西。Facebook 的 Scribe 和雅虎的 Chukwa 都是很好的实现。我对 log4php 知之甚少。

我想要的是对这种日志记录如何工作的高级概述,特别是与 PHP 应用程序结合使用。您可以在处理日志的位置停止;我已经知道我想使用 Hadoop/Hive 进行处理和存储。

我还想对应用程序本身发生的事情进行一些相当低级的了解。例如,如何将点击行为发送给记录器?我也很感激任何可以帮助我入门的阅读材料。

4

4 回答 4

6

您可以购买/获取工具来为您执行此操作或在内部构建。

购买/获取:

1 - 使用 Google/Yahoo 分析标记您的页面 - 这将跟踪页面浏览量、页面流量性能、关键字的 SEO 排名等。

2 - 用于跟踪和记录用户行为,包括点击、交互和性能。我发现没有什么比 ClickTale 更好的了 - http://www.clicktale.com/default_e.aspx - 它视频记录用户会话并将这些“日志文件”放在服务器中。

内部:1 - 在提交到日志数据库的表单中创建隐藏字段也可以。您为表单指定唯一 ID,并在提交期间跟踪其操作。

我敢肯定还有更多,但这些是基础知识。这些不是特定于 PHP 的。

高温高压

编辑#1:

这可能超出了您的问题范围,但跟踪并不一定意味着内部数据。一个例子是向文章或页面添加“喜欢它”或“挖掘它”按钮。这将为您“记录”受欢迎程度。您可以访问 facebook 或 digg.com 查看您网站的进度。它也将有助于搜索引擎优化。基本上,它是一个跟踪系统。而且很容易使用。那里有 PHP 片段,您可以将其复制并粘贴到您的代码中。如果您有 WordPress,则有一个插件 - 只需在插件搜索部分中查找“digg”、“like it”。

回到谷歌分析,如果你想超越跟踪点击,继续做目标/漏斗。它将跟踪用户行为,并回答诸如“我最有价值的关键字是什么?”之类的问题。“我所有的用户都在哪里下车?” “每页的跳出率是多少?” “我的网站的前 3 个入口点是什么?来自什么流量媒介?” 这些是 SEO/SEM 管理者最关心的问题。跟踪和理解绝对是一件好事。

ClickTale 从 Google Analytics 的结尾开始。GA 将在页面级别描述用户行为,而不是在字段级别。有热图的 ClickTale 将回答这些问题“我知道这个页面的跳出率很高,但为什么?哪个字段是我的客户的问题字段?” “用户大部分时间都花在页面的哪个区域?” “我如何向图形人员证明需要重新设计特定部分?”。

编辑#2

对于高流量站点,您将需要扩展您的日志数据库。在报告方面真的很有帮助。我建议的是三层数据库报告结构。第 1 层 = 过去 7 天,第 2 层 = 过去 6 个月,第 2 层 = 一切。您可以根据业务修改这些。关键是,数据从一层移动到另一层。保持新鲜数据随时可用。您希望尽快生成报告。一个巨大的数据库无法扩展。

于 2010-09-13T21:22:30.817 回答
0

您可以通过记录用户所采用的路径、referrer --> new uri 来监控用户点击,假设两者都足够详细且具有描述性。例如,如果用户点击他的一个朋友,您应该记录 uri:

Referrer: /users/41251
Target: /users/66257

正确存储它们以便于查询和报告。在这里,像这样的直接点击会假设目标在推荐人的页面中,朋友也是如此。如果您有更复杂的场景,请务必使用不同的 uri 来描述它们,例如:/users/suggestion/14152对于建议的连接。

加上时间戳,您可以粗略估计他们在每个页面上停留的时间,尽管用户往往会失去焦点、切换标签/应用程序并返回等等。谷歌分析就是其中之一。

对于用户使用热图在您的网站上点击最多的位置的摘要,我喜欢免费 (GPL) Clickheat

于 2010-09-17T08:26:46.047 回答
0

查看Splunk

于 2010-09-18T15:57:17.560 回答
0

在您进行日志记录的前端,这里有一些您可能会觉得有用的示例 PHP 代码:

http://www.alphadevx.com/a/85-Logging-Messages-to-Scribe-from-PHP

在架构方面,Scribe 具有很大的灵活性。我建议在每个应用程序节点上运行一个本地 Scribe 实例,并让您的应用程序在本地登录到 localhost。这些本地 Scribe 实例可以依次配置为在不太忙时登录到中央 Scribe 服务器,否则它们将继续在本地排队消息。您实际上是在按类别汇总的中央服务器上使用您的日志。

我是 Scribe 的忠实粉丝,我认为它的设计很好,因为它的内存和处理器占用空间非常小,而且很容易配置(尽管由于依赖关系而难以安装!)。它只是缺少文档。

于 2010-11-15T13:34:32.800 回答