我正在使用 R 来绘制一些数据。
Date <- c("07/12/2012 05:00:00", "07/12/2012 06:00:00", "07/12/2012 07:00:00",
"07/12/2012 08:00:00","07/12/2012 10:00:00","07/12/2012 11:00:00")
Date <- strptime(Date, "%d/%m/%Y %H:%M")
Counts <- c("0","3","10","6","5","4")
Counts <- as.numeric(Counts)
df1 <- data.frame(Date,Counts,stringsAsFactors = FALSE)
library(ggplot2)
g = ggplot(df1, aes(x=Date, y=Counts)) + geom_line(aes(group = 1))
g
当有时间中断时,我如何要求 R 不要将数据绘制为连续线?我通常每小时都有一个数据点,但有时会有一个休息时间(早上 8 点到 10 点之间)。在这些点之间,我不希望线路连接。这在R中可能吗?
编辑
非常感谢这里的回复。我的数据现在以 10 秒为间隔,我希望使用这些数据进行同样的分析。
df <- structure(list(Date = c("11/12/2012", "11/12/2012", "11/12/2012",
"11/12/2012", "11/12/2012", "11/12/2012", "11/12/2012",
"11/12/2012", "11/12/2012", "11/12/2012", "11/12/2012"),
Time = c("20:16:00", "20:16:10", "20:16:20", "20:16:30",
"20:16:40", "20:16:50", "20:43:30", "20:43:40",
"20:43:50", "20:44:00", "20:44:10"),
Axis1 = c(181L, 14L, 65L, 79L, 137L, 104L, 7L, 0L, 0L,
14L, 0L),
Steps = c(13L, 1L, 6L, 3L, 8L, 4L, 1L, 0L, 0L, 0L, 0L)),
.Names = c("Date", "Time", "Axis1", "Steps"),
row.names = c(57337L, 57338L, 57339L, 57340L, 57341L, 57342L,
57502L, 57503L, 57504L, 57505L, 57506L), class = "data.frame")
我想我理解代码试图做什么,当它将列“组”添加到原始数据帧时,但我的问题围绕着我如何让 R 知道数据现在以 10 秒的间隔?当我应用第一行代码来确定数字是否连续或是否存在间隙时(例如 idx <- c(1, diff(df$Time)),我收到以下错误:
r[i1] - r[-length(r):-(length(r) - lag + 1L)] 中的错误:二元运算符的非数字参数
在我的Time
变量之后,我是否需要添加as.POSIXct
以确保它正确识别时间?