我正在研究用于分析已发布表单数据的星型模式。表单数据将发布到的站点实际上在托管表单的站点之外,因此只有表单中的数据可用。我将提供包含一些额外有用信息的选项,包括隐藏字段、原始推荐人、会话 ID 等。
我将能够使用正则表达式来匹配某些数据类型并将它们提取到特定维度,例如邮政编码。
我有一个解决维度的任意性质的解决方案,它不是一个很好的解决方案,但它会起作用。
我遇到的问题是我不知道我的事实表中会出现什么,它不像我可以聚合一个很好的数值。除了满足这些标准的“是的,有一个表单帖子”这一事实之外。
我想知道我是否以正确的方式处理这个问题?我是否使用了错误的工具来完成这项工作?还是我只是错过了什么?
西蒙。
更多细节:
有两个功能区域,根据标准过滤表单帖子,例如在两个时间戳之间。但就过滤而言,几乎所有东西都可以争夺。选定的表单帖子将用于生成 csv 文件以供导出。
另一个主要领域是分析,研究广告支出转化为客户线索是一个明显的起点。也有点开放式,取决于表单数据。