我有一个包含 5 列和 >100k 行的表
col1 col2 col3 col4 col5
foo bar
foo1 bar1 this1 that1 other1
foo2 bar2 that2 other2
我想在这张表中阅读,以便空白是
- 读为 NA,或
- 这些行被忽略
我试过了a=read.table("a.txt",header=F,sep='\t',na.strings=c("NA","NULL"))
,但发现NA
它只出现在整数列中,而不是字符串中。我一直在尝试对结果表进行子集化以删除带有空格的列,但尚未成功。
我努力了:
subset(a,a$V4!= ' ')
subset(a,a$V4!= '\t')
subset(a,a$V4!= '\w')
subset(a,a$V4!= '\s')
subset(a,a$V4==NULL)
subset(a,a$V4==is.na)
一切都无济于事。
我会很感激任何建议