2

我是商业智能的新手。

我刚刚被一家公司雇用,以完成他们的网络解决方案,实施 BI 模块。经过大量阅读,我想我可以了解 BI 流程是什么样的,您会发现附上我对 BI 流程的想法。

你能告诉我这是否是对所有工作流程的正确看法吗?如果不是请纠正我。另一个问题,我看不到数据挖掘在模式中的位置,如果需要我应该在哪里使用它?

非常感谢,替代文字

4

1 回答 1

7

以下是您可能需要考虑的几点:

  1. 表示层是 Excel 还是 Web 服务,仅此而已,这是否正确?如果您想部署一个 Web 报告平台,例如 SSRS、Cognos、Business Objects、Microstrategy 等,该怎么办?这些平台通常无需 Web 服务即可直接访问数据。

  2. 您可能需要将其他数据输出到平面文件和下游数据库。数据可能基于 OLAP 多维数据集或原始源数据。因此,您可能希望将这些作为目标包含在主数据仓库级别和 OLAP 级别。

  3. 如果您实现 Web 表示层,它可能不仅仅位于 OLAP 多维数据集之上。您很可能会收到一个请求,要求报告未包含在 OLAP 多维数据集中的数据,并且为了支持一些报告而添加它可能不值得。如果是这种情况,那么您可能需要注意主数据仓库可能是 Web 报告平台的来源——而不仅仅是 OLAP。

  4. 数据集市通常不包含聚合数据——它们通常包含详细级别的数据。OLAP 多维数据集对详细数据执行聚合,但底层数据集市本身包含事务级事实。

  5. 您可以拥有由 ETL 流程导入的其他数据源,例如 Web 服务。您可能还想强调存在多个数据库和平面文件,就像您强调可以存在多个数据集市和 OLAP 多维数据集一样。

  6. OLAP 多维数据集不一定需要单独的数据集市。如果您正在构建一个中央数据仓库,您可以创建一个中央 OLAP 多维数据集,并根据多维数据集安全角色限制对数据维度和切片的访问。

  7. 您可能想要指出您需要在加载数据仓库之前加载临时数据库。也许情况并非如此,但通常我建议使用单独的临时数据库,以便在合并到数据仓库之前有一个加载位置。一些 ETL 流程可以直接进入数据仓库,因为它们可以在进入的过程中合并,但是在很多情况下,在将数据合并到最终目的地之前将数据加载到暂存数据库中可能是有意义的。这也意味着 ETL / 存储过程可能应该是图中自己的实体,因为它是一种移动数据的方法,而不是目标或对象。如果您查看图表,您的所有实体都是实际对象,而不是像 MDX 这样的过程。

  8. 您可能希望指示数据通过 ETL 过程加载到数据集市中。ETL 不仅仅是加载数据仓库——它是关于在任何阶段移动数据。即使处理多维数据集也需要 ETL 过程。

  9. 您的 OLAP 服务器不一定要在另一台物理服务器上——它可以是数据库服务器上的一项服务。这仅取决于您是通过纵向扩展还是横向扩展来解决性能问题,还是由于地理性能问题而打算将多维数据集发布到多个 OLAP 服务器。

于 2010-09-16T14:22:43.650 回答