基于 GoodData 对实现 Fact 表的出色建议,我已经能够设计一个模型来满足我们客户对跨不同表连接不同属性的要求。我现在遇到的问题是模型指标是高度非规范化的,数据会重复。我目前正在尝试找出一种对结果进行重复数据删除的方法。
例如,我有两个表——第一个是 NAMES 表,第二个是我的事实表:
名称
Val2 姓名
35 约翰
36 比尔
37 莎莉
事实
VAL1 VAL2 分数课程等级
1 35 50 90%
2 35 50 80%
3 35 50 60%
4 36 10 75%
5 37 40 95%
我想做的是以这样的方式编写一个指标,以便我们可以获得消除重复值的 SCORE 平均值。GoodData 非常出色,因为它实际上可以使用 COUNT(VARIABLE1,RECORD) 指标返回独特的结果,但在消除突破信息时,我似乎无法让平均商店保持不变。如果我保留所有字段(包括 VAL2),它会显示所有内容:
VAL2 分数(平均)
35 50
36 10
37 40
平均:33.33
但是当我删除 VAL2 时,我突然失去了记录的“唯一性”。
得分(平均)
40
我想要的是我们上面得到的 33.33 的分数。
我尝试在 SELECT AVG(SCORE) 中使用 BY 语句,但这似乎不起作用。这几乎就像我需要某种 DISTINCT 子句。关于如何获得上面第一个示例中显示的汇总值的任何想法?