我每季度都在做一个持续的调查。我们让人们注册(他们提供广泛的人口统计信息)。
然后我们让他们回答六个简短的问题,其中有 5 个可能的值更糟、更糟、相同、更好、更好。
当然,随着时间的推移,我们不会有相同的参与者,有些人会退出,有些新人会注册,所以我正在尝试决定如何最好地构建数据库和代码(希望使用 Python、Numpy?)以最好地允许按初始人口统计数据定义的各种类别进行持续收集和分析。截至目前,我们有 700 名左右的参与者,因此数据集并不太大。IE; 人口统计、UID、北、南、住宅。商业 然后回答 Q1 的 6 个问题 Q2 相同,依此类推,然后需要能够切骰子并根据各种人口统计数据对季度答案的值进行平均,以查看随时间推移的趋势。
由于每个季度都有不同的参与者,因此平均、分组等会稍微复杂一些
任何指向此类数据库设计模式的指针?和分析?这是一个稀疏矩阵吗?