我将讨论关于{预算、业务效用函数、时间框架}范围的几点。为方便起见,让我们按照您链接到的架构概念化
维基百科数据仓库文章
操作数据库层
数据仓库的源数据 - 规范化,仅在一处进行数据维护
数据访问层
将源数据转换为信息访问层。
用于提取、转换、加载数据到仓库的 ETL 工具属于这一层。
信息访问层
• 促进报告的数据结构
此处不维护数据。它只是您的源数据的反映
因此,非规范化结构(包含重复但系统派生的数据)
通常在这里最有效
• 报告工具
您实际上如何允许您的用户访问数据
• 预制报告(简单)
•更动态的切片访问方法
用于报告和分析的数据以及用于报告和分析数据的工具
属于这一层。Inmon-Kimball 关于设计方法的差异(
稍后将在 Wikipedia 文章中讨论)与这一层有关。
自己动手(低端)
只需很少的自付费用,只需认识到对非规范化结构的需求就可以为那些不使用它的结构购买一些效率
参与其中(需要一些支出)
您不需要立即使用平台的所有功能。
然而,IMO,你想在一个你知道会成长的平台上,在竞争激烈和整合的 BI 环境中,这似乎是四大企业超级供应商之一(我认为)
- 微软(我们拥有 110 名员工的公司的平台)
- 树液
- 甲骨文
- IBM
双市场状态文章
我的公司正处于这个阶段,使用 SQL Server Integration Services (SSIS) 提供的一些 ETL 功能和一些开源的替代用法,但实际上许可证需要“数据访问层”中的 Talend 产品,这是一种非规范化的报告结构(完全在基本的 SQL Server 数据库中实现)和 SQL Server Reporting Services (SSRS) 可在很大程度上自动化(根据您的技能)预先指定的报告的生成。请注意,SSRS“报告”只是一个(可扩展的)XML 配置/规范,它在运行时通过 SSRS 引擎呈现。导出到 excel 文件等选项是简单的选项。
认真的承诺(需要一些重要的人工承诺)
请注意,我们尚未利用 SQL Server Analysis Services 的数据挖掘/动态切片/切片功能。我们正在朝着这个方向努力,但现在专注于提高“数据访问层”中数据清理的质量。
我希望这可以帮助您了解从哪里开始寻找。