我有一个大尺寸的立方体。目前处理完整需要 2 小时。我现在已经对多维数据集进行了分区并遵循以下策略:
- 流程更新维度
- 过程数据分区(只需要分区)
- 进程索引立方体
因为我在某些维度上几乎没有刚性关系,所以我无法进行流程更新。我现在让它们都变得灵活了。但在那之后,我的立方体的处理时间增加到 2 小时 40 分钟。
现在,我的问题是为什么这里的流程更新需要这么长时间?我怎样才能让它处理得更快?我一次只处理 34 个分区中的 2 个。这是细分:
- 流程更新所有维度 - 2 小时 20 分钟
- 过程数据 2 分区 - 10 分钟
- 过程指数 - 10 分钟