我正在运行一个小脚本,它工作正常,但每当我尝试编写数据帧时,我得到的输出行数(32933)与我期望的行数(18285)不同。
datsort <- read.table("/home/.../vep_data_sorted.csv", header = T, sep="\t", fill = T)
dim(datsort)
#[1] 97059 47
datsort <- datsort[which(datsort$variation_type == "SNV"),]
dim(datsort)
#[1] 40954 47
gmaf <- as.numeric(as.character(datsort$GMAF_freq))
exac <- as.numeric(as.character(datsort$ExAC))
gmaf[which(is.na(gmaf) == T)] <- 0
exac[which(is.na(exac) == T)] <- 0
x <- which(gmaf < 1)
y <- which(exac < 1)
int <- intersect(x,y)
length(int)
#[1] 18285
datsort <- datsort[int,]
dim(datsort)
#[1] 18285 47
write.table(datsort, "/home/.../vep_data_sorted_1per.csv", sep="\t", quote = F, row.names = F)
然后我检查行数和列数
#Rows
wc -l vep_data_sorted_1per.csv
32933 vep_data_sorted_1per.csv
#Column
awk -F '\t' '{print NF}' vep_data_sorted_1per.csv | sort -nu | tail -n 1
47
关于我所缺少的任何建议?谢谢