0

我在一个文件夹中有多个文件,我想使用 R 对每个文件执行相同的操作,而不是每次都更改脚本中的文件名。特别是,我有 26 个 .csv 文件,我需要分别识别其中的重复条目。任何有关执行此操作的最佳方法的建议都将受到赞赏。

4

2 回答 2

5

我会list.fileslapply. 例如,我认为这样的事情是一个好的开始:

 res <- lapply(list.files(path=FILES_DIRECTORY,
                              pattern='*.csv',  ## I look for csv files, 
                              full.names=T),    ## to get full names path+filename
                   function(file){ ff <- read.csv(file)
                                   ff[duplicated(ff),]
                   })

您还可以使用文件名命名结果列表。

  names(res) <- gsub('[.]csv','',
                      list.files(path=FILES_DIRECTORY,pattern='*.csv'))
于 2013-05-29T13:36:28.370 回答
0

也许您应该通过调用终端来完成这种处理,例如:

R --save --args *.csv < myScript.R

请参阅如何从 R 脚本中读取命令行参数?

于 2013-05-29T13:34:29.790 回答