我正在使用 Pentaho 的 BI Suite(社区版)构建 OLAP 分析。我的许多衡量标准都是事实表中变量的标准差。
有人对如何在 Schema Workbench 中定义标准偏差聚合函数有提示吗?我的很多工作都可以从中受益。
提前致谢!
我正在使用 Pentaho 的 BI Suite(社区版)构建 OLAP 分析。我的许多衡量标准都是事实表中变量的标准差。
有人对如何在 Schema Workbench 中定义标准偏差聚合函数有提示吗?我的很多工作都可以从中受益。
提前致谢!
您可以使用 MeasureExpression 这里有关于如何在 Postgresql 中执行此操作的指南,您的基础数据库是什么?
http://blog.endpoint.com/2009/07/subverting-postgresql-aggregates-for.html
长期以来一直有支持自定义聚合器的请求,但尚未完成。
在我的例子中,数据库有 3 行,MDX 立方体有 3124 个单元。
因此,MDX 函数将根据 3124 个单元格值计算标准偏差,而“真正的”统计学家通常会使用所有 3 个轧机行。
为了获得统计学家 STDDEV,我在数据库中添加了一个列,即行值的平方。
然后在蒙德里安我定义了一个新的度量标准,标准开发,如下:
( 平方和 - (平均值 * 平均值)) 的平方根
这对层次结构有一些影响,但这是另一回事。
我现在如何计算标准偏差:
我创建了一个 ID 维度,而不是为了探索,只是为了确保 Mondrian 没有计算已经聚合的值的标准偏差。
然后我使用 MDX 公式创建了一个新的计算成员:Stddev(Descendants([ID_Dimension.ID_Hierarchy],,Leaves),[Measures].[Measure with values to be aggregated])。
性能很烂。
这个想法来自这个非常古老的论坛帖子。