我有一个氨基酸位点的数据框,并且想为这些位点的每个成对组合创建一个新的数据框。
原始数据将如下所示:
df<-cbind(letters[1:5], letters[6:10], letters[11:15])
df
[,1] [,2] [,3]
[1,] "a" "f" "k"
[2,] "b" "g" "l"
[3,] "c" "h" "m"
[4,] "d" "i" "n"
[5,] "e" "j" "o"
我想要的是:
newdf<-cbind(paste(df[,1],df[,2],sep=""),paste(df[,1],df[,3],sep=""),(paste(df[,2],df[,3],sep="")))
newdf
[,1] [,2] [,3]
[1,] "af" "ak" "fk"
[2,] "bg" "bl" "gl"
[3,] "ch" "cm" "hm"
[4,] "di" "dn" "in"
[5,] "ej" "eo" "jo"
实际数据可能有数百行和/或列,因此显然我需要一种较少手动的方式来执行此操作。非常感谢任何帮助,我只是一个谦虚的生物学家,我在这方面的技能相当有限。