在 MYSQL DB 中生成数据/表(事实表/维度表)从文件/不同 DB 等不同源 - 数据集成工具进入图片。
在事实表之上创建模式 - 蒙德里安工具
在创建的多维数据集之上处理用户/角色 - 元数据编辑器
在小表格上创建简单的报表 - 报表设计器
对于 DI 作业/转换、报告、Java 脚本的顺序执行(随时)使用 - 设计工作室
感谢用户 surya.thanuri @ forums.pentaho.com
数据集成工具主要用于 ETL,它是一个单独的工具,您可以忽略它,除非您对来自多个不同数据源的数据进行复杂分析。您不需要将报告“导出”到 pentaho 服务器,您可以将它们直接写入目录,然后从 Pentaho Web 应用程序内部刷新存储库。导出它们只是一种工作流程技术。
你会发现有十几种方法可以用 Pentaho 做任何一件事。例如,我将 CDA 数据源与我的报告一起使用,而不是将 sql 代码放在我的报告中。或者,您可以链接到数据集成服务器以执行数据集成脚本以查看结果集。
只是为了回答您的数据集市问题。一般来说,数据集市可能应该由数据集成工具(根据您的情况,我不完全推荐)或数据库函数/复制流(推荐)来支持。
只是冒险猜测一下,听起来有人向您扔了一个项目说:我们需要一个 BI 系统,这是存储数据的数据库,这是我们已经获得的报告。X 看着 Pentaho,很喜欢。你应该使用它。
您需要做的第一件事是了解数据的形状、体积、表格和相互关系。弄清楚他们想要回答的真正问题是什么。确定他们是否需要实时报告等。等等。如果您甚至需要一个,仅将数据集市本身整合在一起可能需要相当长的时间。我想你可能已经对 Pentaho 本身开枪了。
感谢用户 flamierd @ forums.pentaho.com