r - 拆分后的数据框列名

Question

执行以下代码时

data <- data.frame( A = c("foo", "foo", "bar", "bar"),
                    B = c("foo","bar", "foo", "bar"),
                    C = c("bla", "foo", "bla", "bar"),
                    D = c(1, 2, 3, 4 ),
                    E = c(5, 6, 7, 8 ))

ds <- split(data, list(data$A, data$B, data$C), drop=TRUE)
write.table(ds[1], file="foo.csv", append=FALSE, row.names=FALSE)

foo.csv 看起来像这样：

 "bar.bar.bar.A","bar.bar.bar.B","bar.bar.bar.C","bar.bar.bar.D","bar.bar.bar.E"
 "bar","bar","bar",4,8

即，列名包含用于拆分的列的内容。如何以通用方式将名称更改回原始名称？（我不想分配像“A”、“B”、....这样的列名）

score 3 · Accepted Answer

的输出split是一个list。ds[1]返回 a list，同时ds[[1]]返回第一个列表项中的值。

例子：

ds[1]
# $bar.bar.bar
#     A   B   C D E
# 4 bar bar bar 4 8

ds[[1]]
#     A   B   C D E
# 4 bar bar bar 4 8

要将输出正确写入为 CSV 文件，您需要提取实际的data.frame，因此您需要使用该ds[[1]]方法。

write.table(ds[[1]], file="foo.csv", append=FALSE, row.names=FALSE)

如果您想将所有data.frames 写入单独的 CSV 文件，您可以执行以下操作：

lapply(names(ds), function(x) {
  write.table(ds[[x]], file = paste(x, ".csv", collapse = ""),
              append = FALSE, row.names = FALSE)
})

这将在您的工作目录中创建四个 CSV 文件（名为 bar.bar.bar.csv、bar.foo.bla.csv、foo.foo.bla.csv 和 foo.bar.foo.csv）。

r - 拆分后的数据框列名

1 回答 1

Related

Reference