statistics - 如何在 Pentaho Schema Workbench 中定义标准偏差函数

Question

我正在使用 Pentaho 的 BI Suite（社区版）构建 OLAP 分析。我的许多衡量标准都是事实表中变量的标准差。

有人对如何在 Schema Workbench 中定义标准偏差聚合函数有提示吗？我的很多工作都可以从中受益。

提前致谢！

score 2 · Accepted Answer

您可以使用 MeasureExpression 这里有关于如何在 Postgresql 中执行此操作的指南，您的基础数据库是什么？

长期以来一直有支持自定义聚合器的请求，但尚未完成。

score 1 · Accepted Answer

在我的例子中，数据库有 3 行，MDX 立方体有 3124 个单元。

因此，MDX 函数将根据 3124 个单元格值计算标准偏差，而“真正的”统计学家通常会使用所有 3 个轧机行。

为了获得统计学家 STDDEV，我在数据库中添加了一个列，即行值的平方。

然后在蒙德里安我定义了一个新的度量标准，标准开发，如下：

( 平方和 - (平均值 * 平均值)) 的平方根

这对层次结构有一些影响，但这是另一回事。

score 0 · Accepted Answer

我现在如何计算标准偏差：

我创建了一个 ID 维度，而不是为了探索，只是为了确保 Mondrian 没有计算已经聚合的值的标准偏差。

然后我使用 MDX 公式创建了一个新的计算成员：Stddev(Descendants([ID_Dimension.ID_Hierarchy],,Leaves),[Measures].[Measure with values to be aggregated])。

性能很烂。

这个想法来自这个非常古老的论坛帖子。

3 回答 3