我使用的数据看起来如何(它是 SNP 数据):
AA CC CA GG
GA CA CC GG
GG CCCC CAA GG
CA GG CC GC
在案例 2 之后我希望它如何(由于第 2 列有多个字符,第 3 行被删除,并且所有列都被分成 2)
A A C C C A G G
G A C A C C G G
C A G G C C G C
案例 1
我现在使用的
mydata <- mydata[which(!nchar(as.character(mydata[,5]))>2),]
mydata <- mydata[which(!nchar(as.character(mydata[,6]))>2),]
mydata <- mydata[which(!nchar(as.character(mydata[,7]))>2),]
我希望它是
mydata <- mydata[which(!nchar(as.character(mydata[,5:7]))>2),]
问题是该函数正在计算所有列 5:7 并删除每一行。我想要同样的,但对每一列都这样做,而不是一起做。
案例 2 我的代码使用库
library(dplyr)
library(splitstackshape)
为每列运行拆分单元格,这是第 6 列的单元格
data2$V6 = as.character(data2$V6)
data2 <- cSplit(data.frame(data2 %>% rowwise() %>%
mutate(V6 = V6, V6n = paste(unlist(strsplit(V6, "")),
collapse = ','))), "V6n", ",")
data2$V5 <- NULL
我对所有列问题都做同样的事情我想对所有列潜在的解决方案做同样的事情:不同类型的循环,但我不能让它工作。任何帮助将不胜感激