我已经为此苦苦挣扎了一段时间。我是使用ts数据和所有相关 R 包的新手。我有一个带有几个变量的df,包括格林威治标准时间“%H%M”中的“一天中的时间”和发生采样的日期“%Y/%m/%e”。我想将我的日期数据分类/聚合为“周”(即 %W/%g),并计算在该周发生采样时的平均“一天中的时间”。
通过首先将我的 df 转换为 zoo 对象,然后使用如下所示的 aggregate.zoo 命令,我能够计算数值变量(例如重量)的其他乐趣:
#calculate the sum weight captured every week
x2c <- aggregate(OA_zoo, as.Date(cut(time(OA_zoo), "week")), sum)
但是,我不确定如何解决我正在使用Date 格式而不是num的事实,并且不胜感激任何提示!此外,我显然已经通过分别处理我的每个变量来编码。是否有一种方法可以通过使用 plyr 聚合“每周”在我的 df 上应用不同的 FUN(总和/平均值/最大值/最小值)?还是其他一些包?
编辑/澄清
这dput
是我的完整数据集样本的输出。我有 2004-2011 年的数据。我想使用 ggplot2 查看/绘制的是 TIME 的平均值/中位数(%H%M),在几周内随时间(2004-2011)聚合。现在,我的数据不是按周汇总的,而是每天汇总的(随机样本)。
> dput(godin)
structure(list(depth = c(878, 1200, 1170, 936, 942, 964, 951,
953, 911, 969, 960, 987, 991, 997, 1024, 978, 1024, 951, 984,
931, 1006, 929, 973, 986, 935, 989, 1042, 1015, 914, 984), duration = c(0.8,
2.6, 6.5, 3.2, 4.1, 6.4, 7.2, 5.3, 7.4, 7, 7, 5.5, 7.5, 7.3,
7.5, 7, 4.2, 3, 5, 5, 9.3, 7.9, 7.3, 7.2, 7, 5.2, 8, 6, 7.5,
7), Greenland = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 40L, 28L, 0L,
0L, 34L, 7L, 28L, 0L, 0L, 0L, 27L, 0L, 0L, 0L, 44L, 59L, 0L,
0L, 0L, 0L, 0L, 0L), date2 = structure(c(12617, 12627, 12631,
12996, 12669, 13036, 12669, 13036, 12670, 13036, 12670, 13037,
12671, 13037, 12671, 13037, 12671, 13038, 12672, 13038, 12672,
13038, 12672, 13039, 12631, 12997, 12673, 13039, 12673, 13039
), class = "Date"), TIME = c("0940", "0145", "0945", "2045",
"1615", "0310", "2130", "1045", "0625", "1830", "1520", "0630",
"0035", "1330", "0930", "2215", "2010", "0645", "0155", "1205",
"0815", "1845", "2115", "0350", "1745", "0410", "0550", "1345",
"1515", "2115")), .Names = c("depth", "duration", "Greenland",
"date2", "TIME"), class = "data.frame", row.names = c("6761",
"9019", "9020", "9021", "9022", "9023", "9024", "9025", "9026",
"9027", "9028", "9029", "9030", "9031", "9032", "9033", "9034",
"9035", "9036", "9037", "9038", "9039", "9040", "9041", "9042",
"9043", "9044", "9045", "9046", "9047"))