5

我有一个data.frame时间序列。里面也有NAs 以及我想用一个因素来突出显示一条线的不同部分。

flow.mndnr <- function(id, start, end) {
  uri <- sprintf("http://maps1.dnr.state.mn.us/cgi-bin/csg.pl?mode=dump_hydro_data_as_csv&site=%s&startdate=%s&enddate=%s", id, start, end)
  dat <- read.csv(url(uri), colClasses=c(Timestamp="Date"))
  rng <- range(dat$Timestamp)
  d <- data.frame(Timestamp=seq(rng[1], rng[2], by='day'))
  merge(d, dat, all.x=TRUE)
}
dat <- flow.mndnr("28062001", as.Date("2002-04-02"), as.Date("2011-10-05"))

我可以无条件地绘制它

library(lattice)
xyplot(Discharge..cfs. ~ Timestamp, dat, type='l', cex=0.5, auto.key=TRUE)

在此处输入图像描述

但是当我尝试引入因子时,我无法摆脱连接线

xyplot(Discharge..cfs. ~ Timestamp, dat, type='l',
    groups=dat$Discharge..cfs..Quality, cex=0.5, auto.key=TRUE)

在此处输入图像描述

与 ggplot2 相同

dat$quality <- dat$Discharge..cfs..Quality
ggplot(dat, aes(x=Timestamp, y=Discharge..cfs.)) +
  geom_path(aes(colour=quality)) + theme(legend.position='bottom')

在此处输入图像描述

我试过geom_line没有成功。我在ggplot2 邮件存档中读到这geom_path是要走的路。但这对我来说不太适用。

PS为什么ggplot2不喜欢名字中的点所以我不得不使用另一个?

4

1 回答 1

2

问题在于分组。您可以使用year跳过这些跳转。做就是了:

dat$grp <- format(dat$Timestamp, "%Y")
ggplot(dat, aes(x=Timestamp, y=Discharge..cfs.)) +
    geom_path(aes(colour = quality, group = grp)) + 
    theme(legend.position='bottom')

你得到:

在此处输入图像描述

编辑:详细回答评论:只要您不知道要分组的变量,就无法正确分组。如果您在一年中缺少几个月,那么这段代码当然会产生跳跃。在这种情况下,我建议做这样的事情:

dat$grp <- paste(format(dat$Timestamp, "%Y"), format(dat$Timestamp, "%m"))
ggplot(dat, aes(x=Timestamp, y=Discharge..cfs.)) +
    geom_path(aes(colour = quality, group = grp)) + 
    theme(legend.position='bottom')

你得到这个:

在此处输入图像描述

于 2013-03-06T22:04:01.640 回答