r - 将变量名称分配给 R 中的输出图

Question

我是 R 统计的新用户。我有一个巨大的for循环，包含多个大量文件，循环最终给了我一个图表的结果。

一切正常，除了输出文件名。我到底想做什么？

我在用

data1 <- read.csv("filepath/filename", header=TRUE, sep=",")
data2 <- read.csv("filepath/filename", header=TRUE, sep=",")
data3 <- read.csv("filepath/filename", header=TRUE, sep=",")

等等...阅读我的文件。

我希望输出图形文件名包含生成它的数据文件和列的名称。例如：

graph1-data1-data3-columnE.pdf

重要提示：我正在阅读的所有文件都具有完全相同的列名和编号。

我应该使用什么命令来执行此操作？

score 5 · Accepted Answer

您可以使用paste@EDi 指出的方法来解决它，paste0或者sprintf. 我更喜欢后者，因为它的语法非常简洁。在以下示例%i中（对于整数）被替换为的值i，d1并且d2（%s对于字符串）被替换为的值col。

for(i in 1:n){
    ...
    d1 <- 1    # Index of the first data file
    d2 <- 3    # Index of the second data file
    col <- "E" # Column name
    ...
    outfile <- sprintf("Graph%i-data%i-data%i-column%s.pdf", i, d1, d2, col)
    pdf(outfile)
    ...
    dev.off()
}

一些一般性建议

每当您发现自己创建了名为data1、data2等的对象data3时，您实际上就是在伪造一个对象列表。相反，制作一个适当的列表，您的语法将更紧凑，更易于阅读和编写。

# List all files named `data###.csv`, where ### is a number
my.files <- dir(".", "data[0-9]+\\.csv")

# Load all files in one go
my.data <- lapply(my.files, read.csv, header=TRUE, sep=",")

# Calculate the thing you are interested in        
n <- length(my.files)
for(i in 1:n){
    for(j in 1:n){
        # Do stuff
        pdf(sprintf("Graph-%i-%i.pdf", i, j))
        plot(my.data[[i]], my.data[[j]])
        dev.off()
    }
}

r - 将变量名称分配给 R 中的输出图

1 回答 1

一些一般性建议

Related

Reference