我正在处理一个大型数据集,下面可以显示一个示例。对于我必须处理的大多数单个文件,应该有超过一天的数据。
Date <- c("05/12/2012 05:00:00", "05/12/2012 06:00:00", "05/12/2012 07:00:00",
"05/12/2012 08:00:00", "06/12/2012 07:00:00", "06/12/2012 08:00:00",
"07/12/2012 05:00:00", "07/12/2012 06:00:00", "07/12/2012 07:00:00",
"07/12/2012 08:00:00")
Date <- strptime(Date, "%d/%m/%Y %H:%M")
c <- c("0","1","5","4","6","8","0","3","10","6")
c <- as.numeric(c)
df1 <- data.frame(Date,c,stringsAsFactors = FALSE)
我希望只留下一天的数据。这一天将通过当天的数据点最多来选择。如果由于任何原因两天被捆绑(具有最大数据点数),我希望选择记录的个人价值最高的一天。
在上面给出的示例数据框中,我将留下 12 月 7 日。它有 4 个数据点(与 12 月 5 日一样),但它具有这两天中记录的最高值(即 10)。