所以我有一堆excel文件,我想循环遍历并将特定的不连续列读取到数据框中。将readxl
作品用于这样的基本内容:
library(readxl)
library(plyr)
wb <- list.files(pattern = "*.xls")
dflist <- list()
for (i in wb){
dflist[[i]] <- data.frame(read_excel(i, sheet = "SheetName", skip=3, col_names = TRUE))
}
# now put them into a data frame
data <- ldply(dflist, data.frame, .id = NULL)
这工作(几乎没有),但问题是我的 excel 文件有大约 114 列,我只想要特定的。此外,我不想让R
猜测,col_types
因为它弄乱了其中的一些(例如,对于字符串列,如果第一个值以数字开头,它会尝试将整个列解释为数字,然后崩溃)。所以我的问题是:如何指定要阅读的特定、不连续的列?该range
参数使用cell_ranger
不允许读取不连续列的包。那么有什么选择吗?