我知道有三种类型的事实,并且我读过事务性事实表具有完全附加的事实,这是最有用的类型,但非附加的事实也可以存在吗?甚至是半附加事实。
我问这个是因为我的老师在她的一次演讲中提到了这个:
“虽然非附加事实不存储在事实表中,但重要的是不要忘记它们。对于许多过程,比率是关键的度量,如果没有它,解决方案将有很多不足之处。非附加事实应记录为模式设计的一部分。 ”
如果它们不能存储在那里,如何将它们记录为模式设计的一部分?
我知道有三种类型的事实,并且我读过事务性事实表具有完全附加的事实,这是最有用的类型,但非附加的事实也可以存在吗?甚至是半附加事实。
我问这个是因为我的老师在她的一次演讲中提到了这个:
“虽然非附加事实不存储在事实表中,但重要的是不要忘记它们。对于许多过程,比率是关键的度量,如果没有它,解决方案将有很多不足之处。非附加事实应记录为模式设计的一部分。 ”
如果它们不能存储在那里,如何将它们记录为模式设计的一部分?
说“......没有存储在事实表中”是不正确的,在某些情况下需要存储它们。
例如,我最近在一个数据仓库工作,它有三个日期——订单、激活和完成。这些日期通过维度相关联,但事实度量包括从订单到激活的天数、从激活到完成的天数和从订单到完成的天数。
最佳实践是在 BI 工具中得出这些度量。在这种情况下,您将记录日度量的计算,以展示如何从现有数据值满足要求。
然而,在我们最近的示例中,这些是 KPI 级别的度量,对业务至关重要。我们选择在事实表中实施这些度量,而不是让人们在 Excel、Tableau、PowerBI 等中计算它们(可能不同)。
它们被记录为非相加的,因为总和(days-order-to-completion)是没有意义的,尽管值得注意的是,最小值、最大值和平均值在这种情况下是有意义的。