首先从开源或商业网络分析软件包开始(谷歌),因为阅读网络服务器日志文件并非易事
有些允许将数据映射到其他表(您的用户表与年龄等),或者混合您自己的解决方案以将 Web 会话日志与其他数据映射
除此之外,普通的 SQL 查询将解决您的分析问题,例如
select user.id
from user, log l1, log l2, log l3
where user.id = l1.userid and l1.type = first step
and user.id = l2.userid and l2.type = next step
and user.id = l3.userid and l3.type = last step
and l1.sessionid = l2.sessionid and l2.sessionid = l3.sessionid
将原始数据加载到 BI 框架中可能并不容易。将这样的查询结果加载到 BI 框架中会很有趣
根据您的 Web 应用程序,如果实际会话具有长时间运行的会话 ID 等,或者更改会话 ID,您可能无法识别它们。如果这是一个问题,您需要将您的 Web 分析应用到实际的 Web 服务器代码中,这样您就可以模拟长时间运行的状态并记录下来