我有一个带有VARCHAR
数据类型的自然键的表。传入的提要可以是一个VARCHAR
或BIGINT
自然键,但存储为VARCHAR
数据类型。我们使用自然键生成代理键。输入的每日饲料在自然键上有间隙和岛屿,但最终在追赶过程中被填满。但是,在加载过程中在自然键之上生成的代理不能保证相同的序数,因为数字的间歇性差距。
现在,我需要在数据集上包含一个采样机制,以仅加载 5% 的数据量并将其级联到每日捕获量。由于自然键是 VARCHAR 列,因此我无法使用 MOD 函数提供采样。但是,如果我使用代理键列进行采样,那么随着时间的推移,数据集的增长将超过预期的 5%。
例如,
Day NK SK
1 1 1
1 3 2
2 2 3
3 4 4
3 5 5
3 7 6
4 6 7
. . .
. . .
. . .
有没有更清洁的方法来规避这种情况?