我有一组元素U(最初未知大小),我想生成一个随机样本n << | 你| 元素。流采样适用于此。
当我将U细分为几个子集并随机抽取每个子集的样本(每个样本包含k <= n元素,但通常是k = n)时,问题就出现了。我也知道每个子集中有多少元素。我想知道如何将这些样本(最好一次合并两个样本)组合成一个大小为n的样本。
或者换一种说法,给定不同的集合A和B以及随机样本a和b,我想让c ⊆ a ∪ b,这样c是A ∪ B的随机样本,我可以指定c的大小(通常 | c | 的大小与 | a |)大致相同。