5

以结果数据是原始数据摘要的格式将时间序列数据强制转换为数据框的简单方法是什么?

这可能是一些示例数据,存储在 xts 或 zoo 对象中:

t,                  V1
"2010-12-03 12:00", 10.0
"2010-11-04 12:00", 10.0
"2010-10-05 12:00", 10.0
"2010-09-06 12:00", 10.0
...and so on, monthly data for many years.

我想将其转换为如下数据框:

year, month, V1
2010, 12,    a descriptive statistic calculated of that month's data
2010, 11,    ...
2010, 10,    ...
2010, 9,     ...

我问这个的原因是因为我想在同一个图中绘制每月计算的数据摘要。对于后一种格式的数据,我可以很容易地做到这一点,但还没有找到时间序列格式的绘图方法。

例如,我可以每天测量几年的温度数据,我想在同一图中绘制每年的月平均温度曲线。我没有弄清楚如何使用 xts 格式的数据来做到这一点,或者这是否适合数据的 xts/zoo 格式的目的,这似乎总是带有年份信息。

4

2 回答 2

7

请提供一个可以使用的数据样本,我将尝试提供一个不太笼统的答案。基本上,您可以apply.monthly用来计算 xts 对象的汇总统计信息。然后您可以将索引yearmon转换为并将 xts 对象转换为 data.frame。

x <- xts(rnorm(50), Sys.Date()+1:50)
mthlySumm <- apply.monthly(x, mean)
index(mthlySumm) <- as.yearmon(index(mthlySumm))
Data <- as.data.frame(mthlySumm)
于 2010-12-06T17:03:44.030 回答
1

这是一个使用该tidyquant包的解决方案,其中包括as_xts()将数据帧强制为 xts 对象和将 xts 对象as_tibble()强制为 tibbles(“整洁”数据帧)的函数。

重新创建数据:

> data_xts
           V1
2010-09-06 10
2010-10-05 10
2010-11-04 10
2010-12-03 10

用于as_tibble()转换为 tibble。preserve_row_names = TRUE添加一个名为“row.names”的列,其中 xts 索引作为字符类。Arenamemutate用于清理日期。输出是一个带有日期和值的小标题。

> data_df <- data_xts %>%
     as_tibble(preserve_row_names = TRUE) %>%
     rename(date = row.names) %>%
     mutate(date = as_date(date))
> data_df
# A tibble: 4 × 2
        date    V1
      <date> <dbl>
1 2010-09-06    10
2 2010-10-05    10
3 2010-11-04    10
4 2010-12-03    10

您可以更进一步,使用该mutate功能添加其他字段,例如日、月和年。

> data_df %>%
     mutate(day   = day(date),
            month = month(date),
            year  = year(date))
# A tibble: 4 × 5
        date    V1   day month  year
      <date> <dbl> <int> <dbl> <dbl>
1 2010-09-06    10     6     9  2010
2 2010-10-05    10     5    10  2010
3 2010-11-04    10     4    11  2010
4 2010-12-03    10     3    12  2010
于 2017-03-02T20:07:55.147 回答