6

我正在使用 ggplot 将各种事件绘制为它们开始的日期(x 轴)和开始时间(y 轴)的函数。数据/代码如下:

date<-c("2013-06-05","2013-06-05","2013-06-04","2013-06-04","2013-06-04","2013-06-04","2013-06-04",
    "2013-06-04","2013-06-04","2013-06-03","2013-06-03","2013-06-03","2013-06-03","2013-06-03",
    "2013-06-02","2013-06-02","2013-06-02","2013-06-02","2013-06-02","2013-06-02","2013-06-02")
start <-c("07:36:00","01:30:00","22:19:00","22:12:00","20:16:00","19:19:00","09:00:00",
     "06:45:00","01:03:00","22:15:00","19:05:00","08:59:00","08:01:00","07:08:00",
     "23:24:00","20:39:00","18:53:00","16:57:00","15:07:00","14:33:00","13:24:00")
duration <-c(0.5,6.1,2.18,0.12,1.93,0.95,10.32,
         2.25,5.7,2.78,3.17,9.03,0.95,0.88,
         7.73,2.75,1.77,1.92,1.83,0.57,1.13)
event <-c("AF201","SS431","BE201","CD331","HG511","CD331","WQ115",
      "CD331","SS431","WQ115","HG511","WQ115","CD331","AF201",
      "SS431","WQ115","HG511","WQ115","CD331","AS335","CD331")

df<-data.frame(date,start,duration,event)

library(ggplot2)
library(scales)

p <- ggplot(df, aes(as.Date(date),as.POSIXct(start,format='%H:%M:%S'),color=event))
p <- p+geom_point(alpha = I(6/10),size=5) 
p + ylab("time (hr)") + xlab("date") + scale_x_date(labels = date_format("%m/%d")) +
scale_y_datetime(labels = date_format("%H"))+
scale_colour_hue(h=c(360, 90))
theme(axis.text.x = element_text(hjust=1, angle=0))  

结果图如下所示:

在此处输入图像描述

问题:我如何绘制一个跨越事件持续时间的条形,而不是简单地用一个点指示事件的开始时间(如上所示)?如上面的数据框所示,我有这个持续时间数据(以小时为单位)。或者,我可以提供“停止时间”(未显示)。

我想象解决方案看起来像一个堆叠的条形图。但是,条形图并不完全正确,因为它假定条形图从图的底部开始,并且垂直堆叠的事件之间没有间隙。我的事件可能是不连续的——在沿 y 轴的不同位置“开始”和“停止”。该解决方案还必须考虑到 1) 某些事件最终可能是并发的(时间重叠)和 2) 某些事件将跨越数天。

我会非常感谢任何建议!

4

4 回答 4

5

有点不清楚您到底想要什么-@Michele 的回答似乎不错,我不清楚您是否想使用geom_rect,因为它会使线条变粗(如果是这样,只需更改线宽),或者是否还有其他原因. 我决定尝试使用它geom_rect来启用躲避。我用 x 轴上的开始日期和 y 轴上的开始和结束时间来绘制它。我对数据的设置略有不同以启用它。如果您追求不同的东西,请尝试使其明确,但至少这是另一种选择:

df<-data.frame(date,start,duration,event)

df <- transform(df,
                start = as.POSIXct(paste(date, start)),
                end   = as.POSIXct(paste(date, start)) + duration*3600)

df <- df[c("event", "start", "end")]

df$date <- strptime(df$start, "%Y-%m-%d")
df$start.new <- format(df$start, format = "%H:%M:%S")
df$end.new <- format(df$end, format = "%H:%M:%S")
df$day <- factor(as.POSIXct(df$date))
levels(df$day) <- 1:4
df$day <- as.numeric(as.character(df$day))
df$event.int <- df$event
levels(df$event.int) <- 1:7
df$event.int <- as.numeric(as.character(df$event.int))

p <- ggplot(df, aes(day, start)) + geom_rect(aes(ymin = start, ymax = end,
                                            xmin = (day - 0.45) + event.int/10,
                                            xmax = (day - 0.35) + event.int/10,
                                            fill = event)) +
  scale_x_discrete(limits = 1:4,breaks = 1:4, labels = sort(unique(date)),
                   name = "Start date") + ylab("Duration")

在此处输入图像描述

于 2013-06-16T05:25:50.257 回答
4

感谢 (+1s) @Michele 和 @alexwhan 的意见。使用 geom_rect 我能够获得在 x 轴上同一点上同一日期发生的所有事件。(我预计该数据集最终可能包含数月的事件。)

df<-data.frame(date,start,duration,event)

library(ggplot2)

p <- ggplot(df, aes(xmin=as.Date(date),xmax=as.Date(date)+1,
                    ymin=as.POSIXct(start,format='%H:%M:%S'),
                    ymax=as.POSIXct(start,format='%H:%M:%S')+duration*3600,
                    fill=event))
p <- p+geom_rect(alpha = I(8/10)) 
p + ylab("time") + xlab("date") + scale_x_date(labels = date_format("%m/%d")) +
scale_y_datetime(labels = date_format("%H"))+
scale_colour_hue(h=c(360, 90))
theme(axis.text.x = element_text(hjust=1, angle=0))   

...导致: 在此处输入图像描述

这与我的目标非常接近。我想我可以通过调整 alpha 来处理潜在的过度绘图问题。理想情况下,我希望 y 轴只包含一天(00 到 00)。为此,我想我可能需要重新格式化数据,以便将持续时间超过午夜的事件重新分配到第二天。(不确定如何在 R 中执行此操作。)

于 2013-06-16T15:53:14.467 回答
3

试试这个方法。可能与您的计划不同,但我认为这是显示数据的一种非常清晰的方式:

df<-data.frame(date,start,duration,event)

df <- transform(df,
                start = as.POSIXct(paste(date, start)),
                end   = as.POSIXct(paste(date, start)) + duration*3600)

df <- df[c("event", "start", "end")]

library(reshape2)

df <- melt(df, id.vars="event")
df$value <- as.POSIXct(df$value, origin=as.Date("1970-01-01"))

df <- df[order(df$event, df$value),]

df$eventID <- rep(seq(1, nrow(df)/2, 1), each=2)

library(ggplot2)

ggplot(df) +
  geom_line(aes(value, event, group=eventID, color=event))

在此处输入图像描述

于 2013-06-15T09:02:13.273 回答
1

结合以下优点: (i) y 轴包含单个 ~24 小时周期;(ii) 事件不重叠;(iii) 除图例外,图中标记的事件;(iv) 简洁的代码。

library(dplyr)
library(lubridate)

# Re-create data frame
df <- data_frame(date, start, duration, event) %>%
    mutate(start_dt = as.POSIXct(paste(date, start), tz = 'UTC'),
           start_hr = hour(start_dt),
           end_dt = start_dt + duration * 3600,
           end_hr = hour(end_dt) + (as.Date(end_dt) - as.Date(start_dt)) * 24)

# Plot
df %>% ggplot() +
    geom_segment(aes(x = event, y = start_hr, xend = event, yend = end_hr,
                     color = event, size = 1)) +
    facet_wrap(~ date, nrow = 1) +
    guides(size = 'none')

情节图片:

情节图片

于 2016-11-13T15:56:17.270 回答