1

我正在寻找在数据集市中填充事实表的想法。可以说我有以下尺寸

  1. 医师
  2. 病人
  3. 日期
  4. 地理位置
  5. 患者人口学
  6. 测试

我使用了两个 ETL 工具来填充维度表——Pentaho 和 Oracle Warehouse Builder。日期、患者人口统计和地理位置不会从运营存储中提取数据。所有维度表都有自己的新代理键。

我现在想用患者就诊的详细信息填充事实表。当患者在特定日期就诊时,他会下令进行测试。这是事实表中的信息。为了简单起见,我也省略了其他措施。

我可以在源系统的事实表中创建一个包含所有必需列的单一连接。但是,我需要为患者、医生、测试等存储维度表中的键。实现这一目标的最佳方法是什么?

ETL 工具可以帮助解决这个问题吗?

谢谢你克里希纳

4

1 回答 1

6

每个维度表都应该有一个唯一标识表行描述的对象(人、日期、位置)的 BusinessKey。在加载事实表的过程中,您必须根据 BusinessKey 从维度表中查找 PrimaryKey。您可以选择直接查找维度表,或者在加载事实表之前为每个维度创建一个键查找表。

Pentaho Kettle 具有“数据库值查找”(转换步骤)的目的。您可能还想查看 Kimball 的 Data Warehouse ETL Toolkit 的“Delivering Fact Tables”部分。

于 2010-03-18T18:31:01.183 回答