我在 R 中使用 reshape 来计算 data.frame 列的聚合统计信息。这是我的data.frame:
> df
a a b b ID
1 1 1 1 1 1
2 2 3 2 3 2
3 3 5 3 5 3
这只是一个小测试 data.frame 来尝试理解 reshape 包。我融化,然后投射,试图找到a
s 和b
s 的平均值:
> melt(df, id = "ID") -> df.m
> cast(df.m, ID ~ variable, fun = mean)
ID a b
1 1 1 1
2 2 2 2
3 3 3 3
啊!什么?希望平均值c(2,3)
是 2.5 等等。这是怎么回事?这是一件事:
> df.m
ID variable value
1 1 a 1
2 2 a 2
3 3 a 3
4 1 a 1
5 2 a 2
6 3 a 3
7 1 b 1
8 2 b 2
9 3 b 3
10 1 b 1
11 2 b 2
12 3 b 3
这是怎么回事?我5
的两个都去哪儿了?我在这里有一个非常基本的误解吗?如果是这样:它是什么?