-2

我想使用 dplyr 和 ggplot2 计算和绘制不同颜色动物随时间变化的数量。

我在随机日期对不同动物进行了观察,因此我首先想将这些观察结果分组到 4 天的括号中,然后计算每个 4 天括号的平均颜色。我为前几个创建了带有噱头结果的 Bracket.mean 列,只是为了展示我的想法。如果可能的话,我想在同一个数据框中添加这些方法(而不是创建一个新的 data.frame 或向量)以供以后分析和绘图。

对于该图,我希望显示括号均值及其周围的一些方差度量(SD 或箱线图)以及随时间推移的日常观察结果(可能是背景中观察结果的褪色叠加)。

下面是我正在使用的数据集的一部分(我希望计算一个组成的“Bracket.mean”列)。“计数”是特定“颜色”的给定“日期”上的动物数量。

    Date    Julian  Count   Color   Bracket.color
4/19/16 110 1   50  mean of 4/19-4/22
4/19/16 110 1   50  mean of 4/19-4/22
4/19/16 110 1   100 mean of 4/19-4/22
4/20/16 111 4   50  mean of 4/19-4/22
4/20/16 111 1   0   mean of 4/19-4/22
4/20/16 111 2   100 mean of 4/19-4/22
4/20/16 111 1   50  mean of 4/19-4/22
4/20/16 111 2   100 mean of 4/19-4/22
4/21/16 112 1   100 mean of 4/19-4/22
4/21/16 112 2   50  mean of 4/19-4/22
4/21/16 112 4   50  mean of 4/19-4/22
4/21/16 112 1   100 mean of 4/19-4/22
4/21/16 112 2   50  mean of 4/19-4/22
4/21/16 112 1   0   mean of 4/19-4/22
4/22/16 113 2   0   mean of 4/19-4/22
4/22/16 113 4   50  mean of 4/23-4/26
4/23/16 114 6   0   mean of 4/23-4/26
4/23/16 114 1   50  mean of 4/23-4/26
4/24/16 115 2   0   mean of 4/23-4/26
4/26/16 117 5   0   mean of 4/23-4/26
4/30/16 121 1   50  
5/2/16  123 1   NA  
5/2/16  123 1   50  
5/7/16  128 2   0   
5/7/16  128 3   0   
5/7/16  128 3   0   
5/8/16  129 4   0   
5/8/16  129 1   0   
5/10/16 131 1   50  
5/10/16 131 4   50  
5/12/16 133 1   0   
5/13/16 134 1   50  
5/14/16 135 1   0   
5/14/16 135 2   50  
5/14/16 135 2   0   
5/14/16 135 1   0   
5/17/16 138 1   0   
5/17/16 138 2   0   
5/23/16 144 1   0   
5/24/16 145 4   0   
5/24/16 145 1   0   
5/24/16 145 1   0   
5/27/16 148 3   NA  
5/27/16 148 1   0   
5/27/16 148 1   50  

任何帮助将不胜感激。首先十分感谢!

4

1 回答 1

0

这样的事情应该让你开始。

library(dplyr)
df <- df %>% mutate(Date = as.Date(Date, format='%m/%d/%y'),
                    Start = as.Date(cut(Date, breaks= seq(min(Date), max(Date)+4, by = 4)))) %>%
    mutate(End = Start+3) %>%
    group_by(Start,End) %>%
    summarise(meanColor = mean(Color, na.rm=T),
              sdColor = sd(Color, na.rm=T))
df
#Source: local data frame [10 x 4]
#Groups: Start [?]
#        Start        End meanColor  sdColor
#        <date>     <date>     <dbl>    <dbl>
#1  2016-04-19 2016-04-22  56.25000 35.93976
#2  2016-04-23 2016-04-26  12.50000 25.00000
#3  2016-04-27 2016-04-30  50.00000       NA
#4  2016-05-01 2016-05-04  50.00000       NA
#5  2016-05-05 2016-05-08   0.00000  0.00000
#6  2016-05-09 2016-05-12  33.33333 28.86751
#7  2016-05-13 2016-05-16  20.00000 27.38613
#8  2016-05-17 2016-05-20   0.00000  0.00000
#9  2016-05-21 2016-05-24   0.00000  0.00000
#10 2016-05-25 2016-05-28  25.00000 35.35534

然后使用绘图,

library(ggplot)
ggplot(df) + geom_line(aes(Start,meanColor))
于 2017-02-18T16:03:21.327 回答