0

我有一个带有VARCHAR数据类型的自然键的表。传入的提要可以是一个VARCHARBIGINT自然键,但存储为VARCHAR数据类型。我们使用自然键生成代理键。输入的每日饲料在自然键上有间隙和岛屿,但最终在追赶过程中被填满。但是,在加载过程中在自然键之上生成的代理不能保证相同的序数,因为数字的间歇性差距。

现在,我需要在数据集上包含一个采样机制,以仅加载 5% 的数据量并将其级联到每日捕获量。由于自然键是 VARCHAR 列,因此我无法使用 MOD 函数提供采样。但是,如果我使用代理键列进行采样,那么随着时间的推移,数据集的增长将超过预期的 5%。

例如,

Day    NK       SK  
1      1        1
1      3        2
2      2        3
3      4        4
3      5        5
3      7        6
4      6        7
.      .        .
.      .        .
.      .        .

有没有更清洁的方法来规避这种情况?

4

0 回答 0