0

a)我正在尝试使用Rcbc.read.table中的colbycol包中的函数读取一个相对较大的 .txt 文件。根据我一直在阅读的内容,当我们有大文件(要读取超过 GB 的文件)时,这个包使工作更容易R)并且我们不需要所有的列/变量来进行分析。另外,我读到该函数cbc.read.table可以支持相同read.table的参数。但是,如果我传递参数nrows(为了在 R 中预览我的文件),我会收到以下错误:

#My line code. I'm just reading columns 5,6,7,8 out of 27
i.can <- cbc.read.table( "xxx.txt", header = T, sep = "\t",just.read=5:8, nrows=20)
#error message
Error in read.table(file, nrows = 50, sep = sep, header = header, ...) : 
formal argument "nrows" matched by multiple actual arguments

所以,我的问题是:你能告诉我如何解决这个问题吗?

b) 之后,我尝试使用以下代码读取所有实例:

i.can.b <- cbc.read.table( "xxx.txt", header = T, sep = "\t",just.read=4:8) #done perfectly
my.df <- as.data.frame(i.can.b) #getting error in this line
Error in readSingleKey(con, map, key) : unable to obtain value for key 'Company' #Company is a string column in my data set

所以,我的问题又是:我该如何解决这个问题?

c)您知道在读取文件时我可以过滤(按实例条件)的方法吗?

4

1 回答 1

1

如果您想要预览,那么只需使用read.tablenrow=20 和 colClasses 参数集来读取您的列。

于 2012-05-17T04:41:03.467 回答