0

我创建了一个具有 5 个变量(公司名称、关键项目、原产国、年份和价值)的长格式数据框我想要做的是创建一个表格,其中包含每年一个关键项目的值的平均值。这是我到目前为止所管理的:

for(i in dat$Year) {
  dat[dat$KeyItem == "Total Assets" & dat$Year == i, ]
  FUN1 <- mean(dat$Value, na.rm = TRUE)


}

我在 R 方面几乎没有任何经验,如果这个问题太简单了,我很抱歉。预先感谢你们的帮助。

4

1 回答 1

2

由于您不共享数据,因此很难准确判断您想要什么。可能,您想ddplyplyr包中使用:

mean_values = ddply(dat, .(key_item, year), summarise, mn_value = mean(Value))

如果您的数据集变得非常大,您可能会选择data.table自学在这些情况下速度非常快的软件包。对于中型数据集,ddply可能也较慢,但足够快。

于 2012-10-25T09:52:42.910 回答