我正在使用 .csv 文件读取大型 csv 文件read.csv
。一些网站建议使用 colClasses 为每一列定义类,以加快导入过程。
t = read.csv("pca.csv",header=TRUE,colClasses = classes)
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
scan() expected 'a real', got 'NULL'
classes = c("numeric","integer")
我的一些数据中显然有空值。有没有办法在“数字”或“整数”包含空值的情况下使用 colClasses?此外,有关将大型数据集更快地导入 R 的任何其他技巧都会非常有帮助。我在 SQL 数据库中拥有所有数据,并且我尝试使用 RODBC,它比 read.csv() 慢得惊人。