6

我正在使用 .csv 文件读取大型 csv 文件read.csv。一些网站建议使用 colClasses 为每一列定义类,以加快导入过程。

t = read.csv("pca.csv",header=TRUE,colClasses = classes)
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
scan() expected 'a real', got 'NULL'

classes = c("numeric","integer")

我的一些数据中显然有空值。有没有办法在“数字”或“整数”包含空值的情况下使用 colClasses?此外,有关将大型数据集更快地导入 R 的任何其他技巧都会非常有帮助。我在 SQL 数据库中拥有所有数据,并且我尝试使用 RODBC,它比 read.csv() 慢得惊人。

4

1 回答 1

12

na.strings='NULL'在您的呼叫中使用read.csv.

于 2012-06-19T20:06:28.907 回答