我想实现一个简单的内部表来跟踪我网站上的用户页面浏览量。在不针对某些特定假设的情况下,存储什么有用的数据?最终,我将使用它来构建图表或决策树,以更好地了解我们的用户群。这是静态的(没有 javascript)。
我能想到的事情:
- 访问的 URL
- HTTP 引用[r]er
- HTTP 接受语言
- 浏览器代理
- 会话 ID
- 用户 ID(如果已登录)
- 参观时间
这取决于您的网站的公开程度。如果您的站点需要身份验证,您可以拥有更多受控的统计信息,因为您可以跟踪用户(访问者)历史记录。在用户不需要身份验证的情况下,您仅限于SERVER VARIABLES提供的信息:HTTP_USER_AGENT; 远程用户;远程地址;远程主机; 远程端口;HTTP_COOKIE;HTTP_USER_AGENT。
每次用户登录该网站时,我都为一些非公共网站实现了类似的功能,我存储的信息如下所示:
听起来是个好的开始,
我倾向于存储访问者的 IP 地址,并通过地理 ip 查找访问者的位置。
您也可以考虑对 IP 进行反向 dns 以了解您的用户所在的 isp,您可能永远不会使用它,但如果您有下游缓存导致问题的报告,它可能会很有用。