2

我正在处理基因组数据,并且我有关于核苷酸位置及其保护分数的列(在数据框中)。我有关于哪些核苷酸位置范围是内含子和哪些是外显子的数据。我想创建第三列,并能够指定哪些区域是内含子(如“INTRON”),哪些是外显子(如“EXON”)。

例如,假设在核苷酸位置 1-70000 中,我想指定 10000-10200、17800-21000、43000-54000 作为内含子,并在另一列中作为外显子保留(假设数据)。有没有办法从 ifelse 函数的列中指定多个值范围,因为这或多或少会解决我的问题。有没有更好的方法呢?

4

2 回答 2

5

假设您有这样的数据框:

 d <- data.frame(position=round(runif(100, 1, 70000)))

您可以组合逻辑运算符:

 d$status <- ifelse(( d$position >= 1000 & d$position <= 10200) | (d$position >= 17800 & d$position <= 21000) | (d$position >= 43000 & d$position <= 54000), 'INTRON', 'EXON')

或者您可以使用嵌套的 ifelse:

d$status <- ifelse(d$position >= 1000 & d$position <= 10200, 'INTRON', felse(d$position >= 17800 & d$position <= 21000, 'INTRON', ifelse(d$position >= 43000 & d$position <= 54000, 'INTRON', 'EXON')))
于 2013-09-08T15:52:32.420 回答
-2

假设您有一个表包含一些信息,包括 bmi,您可以使用此代码

x$normal_bmi<- ifelse(x$bmi>=18 & x$bmi<= 25,1, 0)

然后

表(x$normal_bmi)

0 1

40 26

于 2021-08-01T05:44:31.733 回答