我有一个数据框...
df <- tibble(
id = 1:7,
family = c("a","a","b","b","c", "d", "e")
)
家庭最多只能包含 2 个成员(因此他们是个人或成对)。
我需要一个新列“随机”,将数字 1 分配给只有一个成员(例如 c、d 和 e)的家庭,并将 0 或 1 随机分配给包含 2 个成员的家庭(示例中的 a 和 b)。
到最后,数据应如下所示(取决于 0/1 的随机分配)...
df <- tibble(
id = 1:7,
family = c("a","a","b","b","c", "d", "e"),
random = c(1, 0, 0, 1, 1, 1, 1)
)
我希望能够通过 group_by 和 mutate 的组合来做到这一点,因为我主要使用 Tidyverse。
我尝试了以下(但这并没有在家庭中随机分配 0/1)......
df %>%
group_by(family) %>%
mutate(
random = if_else(
condition = n() == 1,
true = 1,
false = as.double(sample(0:1,1,replace = T))
)