目前我们有 12 个不同的数据库,其中 7 个是维度的。我们是一个以知识为基础的非营利组织,我们拥有基于该人所患疾病种类的数据库。
例如。我们的数据库看起来像
- 艾滋病病毒
- 丙型肝炎
- 脑膜炎
等等...
其中每一个都将包含带有表格的数据,例如:
病人
样本(血样)
地点
诊断
性别
提供者
我们不跟踪花费了多少钱,因为我们只跟踪 +ve 和 -ve 样本。
现在,高层管理人员提出了一个问题,即我们应该从孤岛数据集市构建一个数据仓库。
但是,业务用户从来没有问过他们在哪里需要来自两个不同数据库的数据。如果用户没有考虑过,我们还需要 DW 吗?
我想到的更多问题是:
- 每个数据集市的粒度是多少?
- 哪个维度可以作为一致维度?
- ETL 将如何流动?
- 在所有 DM 中实现单一版本的真相?
我只是主动了解什么可以解决我们所处的情况。感谢任何帮助。
谢谢