1

抱歉,如果我在错误的地方发布了这个。我很欣赏这是一个很难回答的问题,因为有太多的变量,但任何建议或指针都会非常感激。

我们有一个非常大、笨重、设计糟糕的立方体。这是一种可怕的“一个立方体来统治他们”类型,如下所示。请注意,名称可能会出卖我工作的地方等的维度已被混淆。

作为一般经验法则,我想要了解的是一个多维数据集可以容纳多少数据。我(和几位专家,我并不声称自己是其中之一!)已向管理层表示,如果他们继续在当前级别向多维数据集添加数据(和属性),它将失败。我们想要的是一种方法来确定这是否会是今年、明年、本月等……是的,我知道这不会有一个确切的公式答案。任何指南都会非常有帮助,因为我在网上找不到任何指南;只有构建的最佳实践,我已经知道这不符合那个!我正在尝试获得预算批准以重新设计它,因此问题...

23 个维度,无 KPI,4 个计算指标和 46 个其他指标

[Dim 1] - 11 attributes
    no hierarchies
    4 address lines, email address, full name, postcode, text provider type
[Area Detail] - 21 attributes
    no hierarchies
    2 address lines, postcode, various name and code fields (string)
[Area Main 1 Month Prior] - 5 attributes
    2 hierarchies
[Area Main 4 Months Prior] - 5 attributes
    2 hierarchies
[Area Main Dimension] - 5 attributes
    2 hierarchies
[Type Dim 1] - 1 attributes
    no hierarchies
[Date Dimension] - 36 attributes
    4 hierarchies
[Event Dimension] - 29 attributes
    no hierarchies
    includes 5 dates which are not linked to date dimension but actually entered
[Event Rank Dimension] - 18 attributes
    no hierarchies
[Event Track Dimension] - 21 attributes
    no hierarchies
    14 date fields
    7 comment fields (freetext)
[History Date Dimension] - 4 attributes
    no hierarchies
    all date data
[Dim 2] - 5 attributes
    no hierarchies
    all freetext fields apart from code
[Official Date Dimension] - 9 attributes
    no hierarchies
    Date field and data about the date
[Previous Dim 2 Dimension] - 4 attributes
    no hierarchies
[xxx Current Record Dimension] - 1 attribute
    no hierarchies
[xxx Dimension] - 102 attributes
    no hierarchies
    4 address fields, postcode, 2 email fields, website
[xxx Dimension 1 Month Prior] - as above
[xxx Dimension 4 Months Prior] - as above
[Dim 3] - 12 attributes
    no hierarchies
[Question Dimension] - 11 attributes
    1 hierarchy
    4 large text fields
[yyy Combination Dimension] - 1 attribute
    no hierarchies
[yyy Current Record Dimension] - 1 attribute
    no hierarchies
[yyy Status Dimension] - 3 attributes
    no hierarchies
[Response Dimension] - 4 attributes
    no hierarchies
    2 large text fields
[zzz Area Dimension] - 4 attributes
    no hierarchies
    2 text fields
[zzz Type Dimension] - 1 attribute
    no hierarchies

我希望这是有道理的,但很乐意提供/澄清细节。

4

1 回答 1

3

根据我的经验,您发布的指标主要与可用性相关 - 添加更多维度和度量不会导致您的多维数据集“失败”。我有更多尺寸和尺寸的成功稳定立方体,例如双倍或更多。

“一个多维数据集来统治它们”是 SQL 2005 中引入的一项架构改进。它优化了构建时间、存储和查询性能。使用 SQL 企业版,您可以将其部分呈现为“透视图”,但我不是粉丝。我更喜欢遵循精心规划的 Dimension 和 Measure 命名,因为大多数客户端工具会按字母顺序对这些对象进行排序。

可能导致您的多维数据集挣扎并可能最终“失败”的是较大维度和度量值组中的数据量。1m 行以下的尺寸通常没有戏剧性。100m 行以下的度量值组通常也适用于一些基本的聚合。比这更大,您可能需要在设计中投入更多的工作。我的目标是使用简单的最终用户工具(例如 Excel 2010+)将 95% 的查询的响应时间缩短到 5 秒以下。

于 2013-03-01T02:39:12.700 回答