1

我正在学习数据仓库的架构和设计,并且有一个关于 OLAP 系统的问题。因此,据我了解,从历史上看(当计算能力和内存不是商品时),数据将被获取并存储在数据仓库中。对于每个分析/BI 任务,都需要配置一个 OLAP 系统,并且来自仓库的查询结果将存储在复杂且需要高维护的单个立方体中。快进到现代云计算时代,数据存储在优化的 OLAP 多维数据集、数据集市或 MPP 解决方案(列式存储)中。

几个问题...

  1. OLAP 多维数据集是虚拟的/临时的,还是占用服务器上的物理空间?存储在数据集市或列式存储中的数据是否占用与数据仓库中相同的空间?如果是,我认为现在这不是问题,因为内存空间很容易获得。

  2. 我理解这个错误的任何部分吗?随时纠正我,就像我说的,我只是在学习。

4

1 回答 1

1
  1. OLAP 多维数据集是虚拟的/临时的,还是占用服务器上的物理空间?
    ->OLAP 多维数据集确实占用服务器上的物理空间。阅读有关处理多维数据集的信息。这会提取源数据并将其以专有格式存储。

  2. 存储在数据集市或列式存储中的数据是否占用与数据仓库中相同的空间?
    -> 我认为,与面向行的数据库相比,列式存储确实减少了占用的空间

于 2021-08-13T14:47:14.080 回答