3

我正在使用 R 使用 zoo 和 chron 进行一些时间序列分析。我有一个包含大量数据的动物园对象,并且需要能够使用该window函数将数据子集为仅一天的价值,然后是第二天的价值,然后是下一天的价值,等等。

我试图找到最简单的方法来创建一个数组,其中包含特定时期内每一天的日期,并提出了以下内容:

orig = c(month=1, day=1, year=2005)
dates <- chron(1:1825, origin=orig, out.format=c(dates="d/m/y", times="h:m"))

这使用儒略日表示法,从我日期期间的第一天开始,有 1825 天(365*5 - 所以五年)。然后我尝试使用该数组的每个元素执行一个 for 循环:

for (date in dates)
{
  s = chron(date, "00:00:00", origin=orig)
  e = chron(date, "23:59:59", origin=orig)

  aeronet_day = window(aeronet, start=s, end=e)
}

但是,这给了我一个警告,说我对aeronetzoo 对象和sande变量使用了不同的来源,并且它没有选择任何数据。

有一个更好的方法吗?或者有办法解决这个问题?基本上我想要的是运行一个 for 循环,在循环中我可以使用aeronet_day = window(aeronet, start=s, end=e)代码生成一个包含一天数据的动物园对象(例如 2005 年 5 月 1 日从 00:00:00 到 23:59:59。

4

3 回答 3

4

假设我们有这些数据:

# create test data
library(zoo)
library(chron)
z <- zooreg(1:30, start = chron("2000-01-01"), freq = 2)

1) 聚合 Raggregate函数有一个 zoo 方法。第二个参数是我们聚合的依据。如果它是一个函数,它将应用于动物园对象的索引。例如,在这里我们计算每个日期的平均值:

z.ag <- aggregate(z, as.Date, mean)

如果我们愿意,我们可以mean用更复杂的函数替换。

2)分裂。Rsplit函数有一个 zoo 方法。如果我们真的想z按日期拆分,那么我们可以这样做。这z.split.list是一个列表,其每个组件都包含一个日期的 zoo 对象。

z.split.list <- split(z, as.Date(time(z)))

现在(a)sapply或(b)lapply在该列表上或(c)使用以下(替换print(zc)为所需的任何处理)。这zc是列表的一个组成部分,即它是仅通过特定日期形成的动物园对象:

for(zc in z.split.list) print(zc)

请注意,它as.Date(time(z))是一个向量,其日期对应于 z 的元素。

编辑:

各种小细节。

于 2011-12-06T20:21:04.913 回答
0

我不熟悉动物园,但我通常只是将日期转换为数字,然后制作序列,然后再转换回来。例如:

> as.Date(Sys.Date():(Sys.Date()+365), origin='1970-01-01')
  [1] "2011-12-06" "2011-12-07" "2011-12-08" "2011-12-09" "2011-12-10" "2011-12-11" "2011-12-12" "2011-12-13"
  [9] "2011-12-14" "2011-12-15" "2011-12-16" "2011-12-17" "2011-12-18" "2011-12-19" "2011-12-20" "2011-12-21"
 [17] "2011-12-22" "2011-12-23" "2011-12-24" "2011-12-25" "2011-12-26" "2011-12-27" "2011-12-28" "2011-12-29"
 [25] "2011-12-30" "2011-12-31" "2012-01-01" "2012-01-02" "2012-01-03" "2012-01-04" "2012-01-05" "2012-01-06"
 [33] "2012-01-07" "2012-01-08" "2012-01-09" "2012-01-10" "2012-01-11" "2012-01-12" "2012-01-13" "2012-01-14"
 [41] "2012-01-15" "2012-01-16" "2012-01-17" "2012-01-18" "2012-01-19" "2012-01-20" "2012-01-21" "2012-01-22"
...
于 2011-12-06T16:39:41.110 回答
0

如果您想按日期做某事,那么您所拥有的就可以了。

一些样本aeronet数据。

last_date <- 1825
n <- 10000
aeronet <- data.frame(
  some.value = seq_len(n), 
  date = as.chron(
    runif(n, 0, last_date), 
    origin = orig,
    out.format = c(dates = "d/m/y", times = "h:m")
  )
)

现在,您可以使用按日期拆分数据,或者使用或从(或使用或其他)split将函数应用于每个日期。tapplyddplyplyraggregate

with(aeronet, split(some.value, date))
with(aeronet, tapply(some.value, date, sum))

library(plyr)
ddply(aeronet, .(date), summarise, sum(some.value))
于 2011-12-06T17:31:04.787 回答