8

我正在尝试按周和月绘制时间序列数据;理想情况下,我想,我想使用箱线图来可视化按周分类的每日数据。虽然我可以使用 更改 x 轴上的标签和网格线scale_x_date,但这不会影响图中的点。

这是问题的演示和我当前的(笨拙的)解决方案。

library(zoo)
library(ggplot2)

d = as.Date(c(as.Date("2007-06-01"):as.Date("2008-05-31"))) # using zoo to reformat numeric 
x = runif(366, min = 0, max = 100)
df = data.frame(d,x)

# PROBLEM #    
p = ggplot(df, aes(d, x))
p + geom_point()
p + geom_boxplot() # more or less useless

# CURRENT FIX #
df$Year.Month <- format(df$d, "%Y-%m")
p = ggplot(df, aes(Year.Month, x))
p + geom_point(alpha = 0.75)
p + geom_boxplot() # where I'm trying to get to...

我确信有一种更优雅的方式可以从内部做到这一点ggplot。我对吗?

@shadow 下面的答案要简洁得多。但是有没有办法使用分箱来做到这一点?stats也许以某种形式使用?

4

1 回答 1

2

您可以将日期视为 R 中的日期,并在 ggplot 中使用 scale_x_date() 来获取所需的 x-labels。

  • 此外,我发现创建一个名为“Month”的新变量因子来按月对箱线图进行分组更容易。在这种情况下,我使用 lubridate 来完成任务。

  • 如果您不想麻烦地创建一个新变量“Month”,您的 bloxplot 将在该月的 15 日绘制,这会使 viz 的阅读变得更加困难。

    library(magrittr)
    library(lubridate)
    library(dplyr)
    
    df %>%
      mutate(Date2 = as.Date(paste0("2000-", month(d), "-", "01"))) %>%
      mutate(Month = lubridate::month(d)) %>%
    
    ggplot(aes(Date2, x, group=Month)) +
      geom_boxplot() +
      scale_x_date(date_breaks="1 month", date_labels = "%b")
    

在此处输入图像描述

如果您不创建变量“Month”,箱线图将无法与 x 刻度线很好地对齐:

在此处输入图像描述

于 2017-02-21T17:31:59.090 回答