这不完全是我正在做的,但我觉得这是一个很好的例子:
假设我有一个连接到我的 ProductSales Fact 表的产品维度表。dimProduct 中的每一行都包含单个产品的所有相关数据(代码、名称、描述等),并且大约有一百万种产品。
我现在需要将产品类别存储到仓库中。每个产品有多个类别,平均为 5 个。
我是否应该为产品适合的每个类别复制 Product Dimension 中的整行,或者我应该使用 dimCategory 维度和两者之间的 dimProductCategory 链接表来雪花我当前的星型模式?
恐怕如果我做前者,那么我的 Dimension 表会变大 5 倍以上,如果我做后者,那么模型会变得更加复杂。