我正在尝试使用 OLTP 数据库构建数据仓库,并且想知道是否需要先定义事实表或维度?
请帮忙?
问候瑜伽士
这是一个非常迭代的过程,通常你会这样:
它当然非常简化。步骤 1-3 通常占用整个项目的 80% 左右,并且由许多子步骤组成。
我建议您阅读 Kimball 关于主题的书:http: //www.amazon.com/The-Data-Warehouse-Toolkit-Dimensional/dp/0471200247
- 更新
我找到了另一个指导方针,它可能会引导您创建成功的 BI 解决方案:
这将导致您得出结论,您需要已经准备好维度和事实。这是对的,也是错的。
您可能会发现一次收集所有需求是不可能的,所以您应该从(并相应地创建表)开始:
当您从客户那里了解更多信息时,请重复步骤 1-3。
这种重复性来自各种因素。客户并不总是了解他们的所有需求,有时甚至可能不是功能性需求,他们怎么会知道。我们作为 DEV 不是领域专家,通常我们边走边学。
在最简单的语言中,维度是您希望过滤数据的属性。而事实表包含与维度主键链接的实际数据。
建议您先收集业务需求并收集 OLTP 列列表,然后坐下来决定您的模型。
还要阅读一些关于数据建模的文章,并为您的应用程序确定最佳维度模型(星形或雪花形)。