0

我有课程作业,我不明白,我尝试给我的导师发电子邮件,但他没有回复,我已经等了大约 2 个月了……我应该创建一个专注于 2 个事实表的星形/雪花模式。

该项目必须专注于 NHS,我们可以自由定义范围,因此我决定专注于 COVID-19。我为 1 个事实表创建了一个星型模式,称为“死亡”,我的想法是数据仓库显示哪些区域的死亡率最高,以便 NHS 知道哪些区域需要相应地管理情况.

我在想,第二个事实表是 Infection/Infected,它应该查看哪些区域的感染率最高。我认为它不起作用,因为“感染”的维度应该与死亡的维度不同(我不确定它们是否必须相同)?

你能和我分享你的想法和建议吗?这是作业简介,简介下方是我的星型架构设计(我认为这是错误的)。

作业简介

星型 1 事实表

4

1 回答 1

0

我不认为需要有两个事实,一个是康复病例,一个是死亡病例。你可以有一个唯一的FactDiagnosticAnalysis聚会:

  • 治疗中心SK
  • 患者SK
  • 治疗SK
  • 员工SK
  • 诊断SK
  • 日期SK
  • 结果
  • InsertedDate :记录插入时间的技术列

结果列将具有以下值:已感染、未感染、已恢复、在特定日期死亡,因为:

  • 患者在康复之前将进行多次分析
  • 病人做分析后到达时不会被感染
  • 一个病人经过多次分析就会康复
  • 经过多次分析,患者可能会死亡

您的模型可能如下所示:

在此处输入图像描述

实际上,在这种情况下,您的事实是无事实的事实。无事实事实表捕获维度之间的多对多关系,但不包含数字或文本事实。

您将报告/仪表板中的度量作为视图(如果您使用 SQL):

  • 死亡率最高的地区
  • 达到最大容量的医疗中心数量
于 2021-02-06T21:32:53.780 回答