我是这R
门语言的新手,我很难计算每个Identification
.
我有一个非常大的每月观察数据集,按如下方式分组:
Code Subset Identification Names Times Value %
100 1001 10011 ..... 201012 10 40
100 1001 10012 ..... 201012 11 60
100 1002 10021 ..... 201012 7 30
100 1002 10022 ..... 201012 13 70
.....
100 1001 10011 ..... 201301 11 45
100 1001 10012 ..... 201301 15 55
100 1002 10021 ..... 201301 9 33
100 1002 10022 ..... 201301 17 67
我需要编写一个函数来计算每个Identification
. 然后,我需要汇总在“子集”的上层计算的值(平均加权“%”)。
我以这种方式将向量的格式更改为times
“ year-month
%Y-%m”:
as.yearmon(as.character(Data$Times), format = "%Y%m")
我试图计算每次Identification
使用split
and的回报sapply
,如下所示:
xm <- split(Data, Identification)
Retxm <- sapply(1:length(xm), function(x) returns(Value))
我使用上面的函数得到的输出是这样的:
[,1] [,2] [,3] [,4]
[1,] NA NA NA NA
[2,] 1.605198e-03 1.605198e-03 1.605198e-03 1.605198e-03
[3,] -1.190902e-02 -1.190902e-02 -1.190902e-02 -1.190902e-02
[4,] 3.318032e-03 3.318032e-03 3.318032e-03 3.318032e-03
输出不是很清楚,所以我会在 Times 的行和标题上的Identification
.
太感谢了!