0

我有一个大立方体,处理时间太长了。我想更改我的多维数据集分区和处理选项。我知道增量过程会将新记录拉入多维数据集中。我的问题是,拥有多个分区并执行增量进程而不是仅拥有一个分区并执行增量进程是否有优势?我不希望每次处理时都会有大量新记录。

4

1 回答 1

0

拥有多个分区的优点是您可以并行加载到每个分区中。如果新记录的数量不是很大,并且处理时间很快,您可以只使用一个分区。

拥有多个分区的问题是您必须管理向每个分区公开哪些数据。如果将相同的数据处理到多个分区中,那么您将在多维数据集中得到重复数据。

于 2013-08-20T13:43:08.603 回答