1

我要建立一种网站跟踪系统。想象一个用户点击各种链接的网站——唯一的用户 ID 和页面标识符跟踪所有页面浏览量。

现在,一个用户可能会查看 20 个页面——一些相关的一些不相关。我要跟踪的是用户是否遵循特定的“路径”。示例“主页”->“产品 A 页面”->“获取更多信息页面”->“购买”->“付费”。每个步骤之间可能还有其他页面浏览量;重要的是如果用户遵循给定的模式。另外,我需要测量每个步骤之间的时间(每个页面视图都有一个时间戳)。

我一直在玩 Reactive Extensions,但我不是该领域的专家,所以我想知道这是否适合 Reactive Framework 或者其他技术是否更合适?

我想象一台服务器获取网站页面视图流,然后是一些花哨的反应式 LINQ 查询来捕获事件(这是我需要帮助的地方)。

我想到的下一个问题是如何在负载平衡器后面托管它(在 Windows Azure 上)?如果您运行两个实例,并且“主页”页面视图转到实例 1,而“产品 A 页面”转到实例 2,它们如何对此进行通信,或者是否应该强制执行某种分片,例如每个用户 ID?

最后,坚持呢?如何储存?您是否应该将数据存储在事件队列模式中,然后当您从服务器重新启动“回放”时将所有内容加载到内存中?

我知道这是很多问题,但我确实喜欢 Reactive Extensions 背后的哲学;我只是无法理解如何“在云端投入生产”:)

谢谢!

卡斯帕

4

1 回答 1

0

这个领域已经有很多解决方案可以集成到您的平台中。你确定你不是在重新发明轮子吗?Google Analytics 具有与此类似的功能。如果您需要走自己的路,那么 SQL Server StreamInsight 可能更合适。

对于防火墙背后的解决方案,另请查看http://piwik.org/(免费、开源)和http://www.haveamint.com/

于 2013-05-13T13:18:15.290 回答