我想知道是否可以使用工作目录中每个文件的某些单元格创建一个新的数据框。例如说如果我有 2 个这样的数据框(请忽略这些数字,因为它们是随机的):
假设在每个数据集中,第 4 行是我的值的总和,第 5 行是缺失值的数量。如果我将缺失值的数量表示为“M”,将列总和表示为“N”,那么我想要实现的是下表:
所以每个文件“N”和“M”都在 1 行中。
我在目录中有很多文件,所以我在列表中阅读了它们,但不确定在文件列表中执行此类任务的最佳方法是什么。
这是我显示的表格的示例代码以及我如何在列表中阅读它们:
##Create sample data
df = data.frame(Type = 'wind', v1=c(1,2,3,100,50), v2=c(4,5,6,200,60), v3=c(6,7,8,300,70))
df2 =data.frame(Type = 'test', v1=c(3,2,1,400,40), v2=c(2,3,4,500,30), v3=c(6,7,8,600,20))
# write to directory
write.csv(df, file = "sample1.csv", row.names = F)
write.csv(df2, file = "sample2.csv", row.names = F)
# read to list
mycsv = dir(pattern=".csv")
n <- length(mycsv)
mylist <- vector("list", n)
for(i in 1:n) mylist[[i]] <- read.csv(mycsv[i],header = TRUE)
如果你能给我一些关于这是否可能以及我应该如何处理的建议,我会非常感激?
非常感谢,
阿扬