4

我是 R 统计的新用户。我有一个巨大的for循环,包含多个大量文件,循环最终给了我一个图表的结果。

一切正常,除了输出文件名。我到底想做什么?

我在用

data1 <- read.csv("filepath/filename", header=TRUE, sep=",")
data2 <- read.csv("filepath/filename", header=TRUE, sep=",")
data3 <- read.csv("filepath/filename", header=TRUE, sep=",") 

等等...阅读我的文件。

我希望输出图形文件名包含生成它的数据文件和列的名称。例如:

graph1-data1-data3-columnE.pdf

重要提示:我正在阅读的所有文件都具有完全相同的列名和编号。

我应该使用什么命令来执行此操作?

4

1 回答 1

5

您可以使用paste@EDi 指出的方法来解决它,paste0或者sprintf. 我更喜欢后者,因为它的语法非常简洁。在以下示例%i中(对于整数)被替换为 的值id1并且d2%s对于字符串)被替换为 的值col

for(i in 1:n){
    ...
    d1 <- 1    # Index of the first data file
    d2 <- 3    # Index of the second data file
    col <- "E" # Column name
    ...
    outfile <- sprintf("Graph%i-data%i-data%i-column%s.pdf", i, d1, d2, col)
    pdf(outfile)
    ...
    dev.off()
}

一些一般性建议

每当您发现自己创建了名为data1data2等的对象data3时,您实际上就是在伪造一个对象列表。相反,制作一个适当的列表,您的语法将更紧凑,更易于阅读和编写。

# List all files named `data###.csv`, where ### is a number
my.files <- dir(".", "data[0-9]+\\.csv")

# Load all files in one go
my.data <- lapply(my.files, read.csv, header=TRUE, sep=",")

# Calculate the thing you are interested in        
n <- length(my.files)
for(i in 1:n){
    for(j in 1:n){
        # Do stuff
        pdf(sprintf("Graph-%i-%i.pdf", i, j))
        plot(my.data[[i]], my.data[[j]])
        dev.off()
    }
}
于 2012-11-15T14:28:45.297 回答