请原谅我这个毛骨悚然的问题 - 我对 OLAP 和多维数据集并不是很熟悉。说明一下我的情况...
我想建立一个数据库来存储问卷结果,每个问卷可能有几十个问题。在收集了几千份已完成的问卷后,我想分析结果,这听起来像是 OLAP 类型的东西(我对此知之甚少)的一个很好的候选者。我需要能够对“所有拥有狗的 20-30 岁男性受访者”进行查询——即结合“你多大了”、“你有没有狗”等的答案。
我还希望能够存储下个月以及下个月的调查结果等,并运行显示本月与上个月的查询等。到目前为止,一切都很好,我想。
这是我的问题的核心:虽然这个月我的问卷可能有关于性别、年龄和养狗的问题,但下个月的问卷可能会包括一个关于(比如)眼睛颜色的问题。它可能(或可能不会)也放弃一些问题。这在 OLAP 世界中是否可行,或者您在设计多维数据集时是否需要提前了解所有“维度”(如果我使用了正确的术语)?
此外,如果我正在运行多个不同但重叠的问题的调查,我可以将它们全部存储在同一个多维数据集中并跨调查运行查询吗?每个调查可能有几十个问题,其中几十个与其他调查重叠。OLAP 系统是否适合这种事情?我只是不知道它们有多严格,以及它们是否真的适合这种用法。
非常感谢任何帮助。
PS。在有人建议之前,我刚刚购买了 Kimball 的数据仓库工具包,但还没有机会阅读它。(我怀疑它可能不会直接回答这个问题)。