0

我正在运行一个小脚本,它工作正常,但每当我尝试编写数据帧时,我得到的输出行数(32933)与我期望的行数(18285)不同。

datsort <- read.table("/home/.../vep_data_sorted.csv", header = T, sep="\t", fill = T)
dim(datsort)
#[1] 97059    47

datsort <- datsort[which(datsort$variation_type == "SNV"),]
dim(datsort)
#[1] 40954    47

gmaf <- as.numeric(as.character(datsort$GMAF_freq))
exac <- as.numeric(as.character(datsort$ExAC))

gmaf[which(is.na(gmaf) == T)] <- 0
exac[which(is.na(exac) == T)] <- 0

x <- which(gmaf < 1)
y <- which(exac < 1)

int <- intersect(x,y)
length(int)
#[1] 18285

datsort <- datsort[int,]
dim(datsort)
#[1] 18285    47

write.table(datsort, "/home/.../vep_data_sorted_1per.csv", sep="\t", quote = F, row.names = F)

然后我检查行数和列数

#Rows    
wc -l vep_data_sorted_1per.csv
32933 vep_data_sorted_1per.csv
#Column
awk -F '\t' '{print NF}' vep_data_sorted_1per.csv | sort -nu | tail -n 1
47

关于我所缺少的任何建议?谢谢

4

0 回答 0