如果我们想为客户设计一个包含所有指标的表格,表格的设计应该是什么?
更多细节:假设有 1000 万客户。一位客户将有一行,指标可分为两种类型:1. 不变的:如出生日期、性别等。 2. 变化的:如客户上次购买的日期等。
问题:对此类数据进行建模的最佳方法是什么?
如果有任何信息不清楚,请告诉我。
如果我们想为客户设计一个包含所有指标的表格,表格的设计应该是什么?
更多细节:假设有 1000 万客户。一位客户将有一行,指标可分为两种类型:1. 不变的:如出生日期、性别等。 2. 变化的:如客户上次购买的日期等。
问题:对此类数据进行建模的最佳方法是什么?
如果有任何信息不清楚,请告诉我。
免责声明:与大多数此类问题一样,“这取决于”您需要用它做什么、多维数据集是否最终会呈现数据、您的用户是谁、需求是什么等。
如果你有这么多记录,Kimball 会建议一张大桌子上的 Type 2 不适合你,所以我可以向你指出 Kimball 文献的方向,他们称之为 Mini Dimensions(负责 Type 4 和 Type 5 SCD),也在这里描述:http ://www.kimballgroup.com/2010/09/design-tip-127-creating-and-managing-mini-dimensions/
我喜欢这些,特别是当您将“持久”键与主维度键一起保留在事实中时,并且当您将当前迷你维度键保留在主维度中时。如果您无法在垃圾维度中对迷你维度的变化进行建模,那么将变化信息保存在单独的表中可能仍然有价值。