我正在建模一个具有 6 维的数据仓库。其中一个维度是客户端,它有大约 600k 行,还有一些其他维度,例如帐户和产品。我通过乘以每个维度表的基数来估计事实表的行数,结果为 1*10^12 行。我的问题是,如果客户没有某个产品,该产品是否会有一行(在事实表中有cero 值),或者根本不会有一行?我需要这些信息来知道我的近似值是行数的上限,还是确切的行数。
问问题
427 次
1 回答
1
您不需要为每个维度组合输入一个条目。
通常,事实表(或多维数据集)与理论大小(即维度基数的乘积)相比会非常小。即使维度数量相对较少(例如,时间、产品、地理、客户、销售等),该理论行数(或单元格)也可能非常非常大。这被称为立方体的稀疏性;OLAP 引擎(例如,icCube、SSAS 等)通常被构建为有效地处理这种稀疏性。
于 2013-05-14T14:28:01.183 回答