3

执行以下代码时

data <- data.frame( A = c("foo", "foo", "bar", "bar"),
                    B = c("foo","bar", "foo", "bar"),
                    C = c("bla", "foo", "bla", "bar"),
                    D = c(1, 2, 3, 4 ),
                    E = c(5, 6, 7, 8 ))

ds <- split(data, list(data$A, data$B, data$C), drop=TRUE)
write.table(ds[1], file="foo.csv", append=FALSE, row.names=FALSE)

foo.csv 看起来像这样:

 "bar.bar.bar.A","bar.bar.bar.B","bar.bar.bar.C","bar.bar.bar.D","bar.bar.bar.E"
 "bar","bar","bar",4,8

即,列名包含用于拆分的列的内容。如何以通用方式将名称更改回原始名称?(我不想分配像“A”、“B”、....这样的列名)

4

1 回答 1

3

的输出split是一个listds[1]返回 a list,同时ds[[1]]返回第一个列表项中的值。

例子:

ds[1]
# $bar.bar.bar
#     A   B   C D E
# 4 bar bar bar 4 8

ds[[1]]
#     A   B   C D E
# 4 bar bar bar 4 8

要将输出正确写入为 CSV 文件,您需要提取实际的data.frame,因此您需要使用该ds[[1]]方法。

write.table(ds[[1]], file="foo.csv", append=FALSE, row.names=FALSE)

如果您想将所有data.frames 写入单独的 CSV 文件,您可以执行以下操作:

lapply(names(ds), function(x) {
  write.table(ds[[x]], file = paste(x, ".csv", collapse = ""),
              append = FALSE, row.names = FALSE)
})

这将在您的工作目录中创建四个 CSV 文件(名为 bar.bar.bar.csv、bar.foo.bla.csv、foo.foo.bla.csv 和 foo.bar.foo.csv)。

于 2013-10-02T10:28:25.557 回答