我需要找到一种对组进行抽样的方法,以便观察到的比例与预期的比例相匹配。我想在每个组中保留尽可能多的观察结果。
简单示例:A 组 = 302 (60.3%) B 组 = 199 (39.7%)
我期望的比例是 46.6% 和 53.4%,所以在这种情况下,我将保留 B 组中的所有观察值,并对 A 组进行 0.576 采样,以获得 174 个观察值。它是否正确?
无论如何,是否可以在 SAS 或 R 中编写一条规则,为您提供 n 个组的适当采样率?我的实际问题涉及 14 个组,计数范围从 2 到 77:
A 组 = 77,观察 = 21.51%,预期 = 15.10%
B 组 = 5,观察 = 1.4%,预期 = 0.54%
C 组 = 2,观察 = 0.56%,预期 = 1.62%
等等
非常感谢您的帮助。