在数据仓库上工作,并正在寻找有关具有多个维度与具有属性的大维度的建议。
我们目前有 DimEntity、DimStation、DimZone、DimGroup、DimCompany,并且有多个事实表,其中包含来自每个维度的键。这是最好的方法,还是只有一个维度 DimEntity 并包括站、区域、组和公司作为实体的属性更好?
我们已经使用我们的 ETL 走了单独维度的路线,因此填充和构建星型模式的工作不是问题。性能和可维护性很重要。这些尺寸不会经常变化,因此请寻求有关处理此类尺寸的最佳方法的指导。
事实表有超过 1 亿条记录。实体维度有大约 1000 条记录,其他列出的每条记录不到 200 条。