0

首先,我很抱歉标题......一旦有人回答它并且我明白我的实际问题是什么,我会提出一个更好的。

我正在创建一个事实表,它将衡量与学校相关的资源数量:

学校
数量 学生
数量 员工
数量 计算机数量(行政使用和学生使​​用)


FACT_SCHOOL_RESOURCES

School (FK)                                    
Location (FK)                                 
Education Type (FK)                     
Total_Schools*                               
Total_Students                              
Total_Employees                           
Total_Students_Computers           
Total_Administration_Computers   

*在学校数量中,每条线将具有相同的值 (1)。

我的问题是有一些与学校有关的“基础设施”问题,我实际上不能将其作为其属性之一(名为“基础设施”的属性),因为有不止一种类型(能源、水源, Waste Disposal...) 并且我不能将每种类型都用作属性,因为对于每种类型,我与我的学校维度是多对多的关系,例如:

电源
太阳能电池板
发电机
城市能源供应
...

废物处理
垃圾填埋场
焚烧
回收
堆肥
废物转化为能源
...

使用这些示例,学校可以同时进行垃圾填埋和回收,因为它可以处理废物或利用城市能源供应,同时还可以使用发电机或太阳能电池板。

所有这些都是必要的,因为研究表明,其中一些问题(以及我没有提到的许多其他问题)与“教学质量”有关,应该有一种方法来分析这一切。

在星型模式上解决此问题的最佳方法是什么?可能吗?

4

1 回答 1

2

我认为您正在寻找超越星型模式的东西。如果您想对哪些因素与某些指标(例如教学质量)最密切相关进行多变量分析,那么您可能需要考虑一个多维数据集。

将每种类型的电源和废物处理的存在视为一个属性。也许您可以从每个因素的二进制标志这样简单的东西开始。然后,您可以使用多维数据集中的不同切片测试您的指标和因子之间的相关性。

于 2015-07-04T13:10:49.753 回答