我有一个数据框,例如:
df <- data.frame(
type = c("BND", "INV", "BND", "DEL", "TRA"),
chrom1 = c(1, 1, 1, 1, 1),
chrom2 = c(1, 1, 2, 1, 3)
)
我想将所有df[df$type=='BND',]
实例重新分配给INV
或TRA
取决于 和 中的chrom1
值chrom2
。
我正在尝试fct_recode
从forcats包中使用:
library(forcats)
df$type <- ifelse(df$type=="BND",
ifelse(df$chrom1 == df$chrom2,
fct_recode(df$type, BND="INV"),
fct_recode(df$type, BND="TRA")),
df$type)
但是,这将我的因素重新编码为数字:
type chrom1 chrom2
1 1 1 1
2 3 1 1
3 1 1 2
4 2 1 1
5 4 1 3
这是我的预期结果:
type chrom1 chrom2
1 INV 1 1 # BND -> INV as chrom1==chrom2
2 INV 1 1
3 TRA 1 2 # BND -> TRA as chrom1!=chrom2
4 DEL 1 1
5 TRA 1 3
如何以这种方式将一个因素分成两个级别?