0

我有一个包含不同尺寸的制表符分隔日志文件的目录,我正在尝试将它们加载到 R 中。

Dir:
File1 (col1,col2,col3)
File2 (col3,col4,col5,col6,col7)
File3 (col1,col8,col9,col10)

为此:我将目录中的所有文件连接到:all_files.tsv

当我尝试将它们加载到 R 中时,正如预期的那样,它给了我一条错误消息:

扫描错误(文件,内容,nmax,sep,dec,quote,skip,nlines,na.strings,:第 436 行没有 12 个元素

我正在使用的代码是:

 data <- read.table("all_vid_logs.tsv",
                   header=FALSE,
                   sep="\t"         # use "\t" for tab-delimited files
    )

所以,我的问题是: 1. 将所有这些文件加载​​到 R 中的数据框中的最佳方法是什么?

我期望的输出是一个包含所有列的单一平面结构。

4

1 回答 1

1

显然它们有不同的长度(nrows)。然后read.table/read.csv可能无法读取您的连接文件。

因此,将它们分别读入单独的数据帧中。然后用 NA-filling 找出你需要做的连接操作。

df1 <- read.csv(file1, ...)
df2 <- read.csv(file2, ...)
于 2015-04-08T00:10:10.860 回答