-1

请我不知道在 R 中是否有一种简单的方法可以做到这一点。我有大约 5000 行的 3 列(孩子、父亲、母亲)。我正在尝试将零 (0) 分配给父亲列中的 25%、50% 和 75%,即假设特定比例未知 (0)。我希望它根据每个父亲的孩子总数根据每个父亲的行数进行分配。在下面的数据中,我希望脚本将 g、k、u 和 x 的 25% 替换为 0。谢谢


child   father mother
1          g      m1
2          g      m2
3          g      m1
4          g      m2
5          g      m1
6          g      m2
7          k      m1
8          k      m2
9          k      m1
10          k      m2
11          u      m1
12          u      m2
13          u      m1
14          u      m2
15          u      m1
16          x      m2
17          x      m1
18          x      m2
19          x      m1
20          x      m2
4

1 回答 1

1

这将在每组中查找father并返回一个向量,其中 25% 的案例设置为 0。将其保存在当前变量的顶部将有望为您提供所需的内容:

test <- read.table(textConnection("child father mother
1 g  m1
2 g  m2
3 g  m1
4 g  m2
5 g  m1
6 g  m2
7 k  m1
8 k  m2
9 k  m1
10 k  m2
11 u  m1
12 u  m2
13 u  m1
14 u  m2
15 u  m1
16 x  m2
17 x  m1
18 x  m2
19 x  m1
20 x  m2"),
header=TRUE,stringsAsFactors=FALSE)

为了保守起见,我将 25% 向下舍入。floor可以替换为roundceil如果合适的话。

test$father <- unlist(
    ave(test$father,test$father,
           FUN=function(x) {
               x[1:floor(length(x)*0.25)] <- 0
               x
           }
    )
)

结果:

test
> test
   child father mother
1      1      0     m1
2      2      g     m2
3      3      g     m1
4      4      g     m2
5      5      g     m1
6      6      g     m2
7      7      0     m1
8      8      k     m2
9      9      k     m1
10    10      k     m2
11    11      0     m1
12    12      u     m2
13    13      u     m1
14    14      u     m2
15    15      u     m1
16    16      0     m2
17    17      x     m1
18    18      x     m2
19    19      x     m1
20    20      x     m2
于 2012-09-10T22:19:04.660 回答