0

我知道以前有人问过类似的问题,但我还没有找到我所需要的答案。这似乎是我缺少的一个简单的解决方案。

我有一个大约 20,000 名参与者的样本,并想从该样本中随机选择 2500 人来接收礼品卡,并从另一个独特的 2500 人(不在第一组中)获得现金津贴。参与者不应以任何方式重复/重复。参与者由唯一的 ID 标识。

我为代表参与者的每一行创建索引(我相信这个步骤可以避免)。

Npool=1:dim(pool_20K)[[1]]
giftcards=sample(Npool,2500)

-- 我如何创建现金津贴组,使他们成为唯一的参与者并且不包括为礼品卡选择的参与者?

之后,我会将索引与数据结合起来

giftcards_ids=pool_20K[giftcards, ]

有什么见解吗?我觉得我把一个相当简单的问题复杂化了。

先谢谢了!!

4

1 回答 1

1

洗牌整个事情,然后选择子集:

shuffled.indices = sample(nrow(pool_20K))

giftcards = shuffled.indices[1:2500]
cash = shuffled.indices[2501:5000]
于 2013-10-04T16:01:30.013 回答