我正在使用以下 R 代码,该代码是从其他地方(https://support.bioconductor.org/p/70133/)复制而来的。似乎很适合我希望做的事情(即从数据集中删除/折叠重复项),但我不明白最后一行。我想知道删除/折叠重复项的依据是什么。有人评论说它是基于中值绝对偏差 (MAD),但我没有遵循这一点。有人可以帮我理解这一点吗?
Probesets=paste("a",1:200,sep="")
Genes=sample(letters,200,replace=T)
Value=rnorm(200)
X=data.frame(Probesets,Genes,Value)
X=X[order(X$Value,decreasing=T),]
Y=X[which(!duplicated(X$Genes)),]