我正在尝试将一个大的制表符分隔文件读入 R。
首先我尝试了这个:
data <- read.table("data.csv", sep="\t")
但它正在读取一些数值变量作为因素
所以我尝试根据我希望每个变量的类型来读取数据,如下所示:
data <- read.table("data.csv", sep="\t", colClasses=c("character","numeric","numeric","character","boolean","numeric"))
但是当我尝试这个时,它给了我一个错误:
扫描错误(文件,什么,nmax,sep,dec,quote,skip,nlines,na.strings,:scan()预期'a real',得到'“4”'
我认为可能是原始原始文件中的某些数值周围有引号,但我不确定。