5

我有时间序列数据(我已将其作为 data.frame 发布在这里):

x <- structure(list(date = structure(c(1264572000, 1266202800, 1277362800, 
1277456400, 1277859600, 1278032400, 1260370800, 1260892800, 1262624400, 
1262707200), class = c("POSIXt", "POSIXct"), tzone = ""), data = c(-0.00183760994446658, 
0.00089738603087497, 0.000423513598318936, 0, -0.00216496690393131, 
-0.00434836817931339, -0.0224199153445617, 0.000583823085470003, 
0.000353088613905206, 0.000470295331234771)), .Names = c("date", 
"data"), row.names = c("1", "2", "3", 
"4", "5", "6", "7", "8", "9", "10"
), class = "data.frame")

将其绘制为 ggplot 中的条形图的最佳方法是什么,它将显示每月的总值(以月份名称作为文本)?

我可以通过添加月份字段来手动执行此操作:

x$month <- format(x$date, format="%B")
ddply(x, .(month), function(x) sum(x[, "data"]))

然后独立绘制,但使用这种方法没有正确排序月份(假设我需要创建一个有序因子?);我还假设 ggplot 有一种“更简单”的方式。

4

1 回答 1

12

我绝不是时间序列数据方面的专家,但这段代码对我有用:

#The binning by month, saving as a date
x$month <- as.Date(cut(x$date, breaks = "month"))

#Plotting
p <- ggplot(x, aes(month, data))+
     stat_summary(fun.y = sum, geom = "bar")

#My suggestions for display
minmax <- max(abs(x$data))

p + geom_hline(y = 0)+
    scale_x_date(minor = "month")+
    ylim(-minmax, minmax)
    # or more ggplot2 accurately
    #+coord_cartesian(ylim = c(-minmax, minmax))

根据我的建议,您最终会用一条线突出显示零,并且 y 轴围绕 0 对称。我将 x 轴次要网格线更改为“月”,因为每个月的条形图在每个方向上延长了几周,这对于数据的聚合方式实际上没有意义。

编辑: 当然,大部分代码只是为了创建每月总和。如果您的日期数据采用日期格式,则日期刻度会自动用于轴。要更改主要的 x 中断及其格式,您可以使用scale_x_date()

p + scale_x_date(major = "month", format = "%b")
#or
p + scale_x_date(major = "month", format = "%B %Y")

有关?strftime格式字符串含义的详细信息,请参阅。

于 2010-08-16T22:55:51.820 回答