1

我需要将几个“tibble”转换为“tsibble”。

这里有一个简单的例子:

require(tidyverse)
require(lubridate)

time_1 <- c(ymd_hms('20210101 000000'),
            ymd_hms('20210101 080000'),
            ymd_hms('20210101 160000'),
            # ymd_hms('20210102 000000'),
            ymd_hms('20210102 080000'),
            ymd_hms('20210102 160000'))

df_1 <- tibble(time_1, y=rnorm(5))

df_1 %>% 
  as_tsibble(index=time_1)

这段代码按预期工作。但是,如果日期都是午夜,则此代码会引发错误:

time_2 <- c(ymd_hms('20210101 000000'),
            ymd_hms('20210102 000000'),
            ymd_hms('20210103 000000'),
            # ymd_hms('20210104 000000'),
            ymd_hms('20210105 000000'),
            ymd_hms('20210106 000000'))

df_2 <- tibble(time_2, y=rnorm(5))

df_2 %>% 
  as_tsibble(index=time_2)

我不想以这种方式解决这个问题,因为该as.Date函数会更改列类型。

df_2 %>% 
  mutate(time_2=as.Date(time_2)) %>% 
  as_tsibble(index=time_2)

我也不想以这种方式解决问题,因为在将 tibble 转换为 tsibble 后,我需要应用该fill_gaps函数,该函数不会ymd_hms('20210104 000000')在第二种情况下创建。

df_2 %>% 
  as_tsibble(index=time_2, regular=FALSE)

这是一个错误吗?

谢谢。

4

1 回答 1

2

tsibble 的FAQ中解释了这种行为。

基本上ymd_hms()每天午夜测量的次日数据 ( ) 不一定有 1 天(24 小时)的间隔。考虑到由于您所在时区的夏令时,有些日子会发生变化,因此午夜和第二天午夜之间的小时数可能是 23 或 25 小时。

如果您使用的是每天测量的数据,则应使用ymd()精确的日期。如果您愿意,您可以将其转换回日期时间as_datetime()

就我个人而言,我认为这不会产生错误,但是如果它确实会简单得多。也许这里的适当间隔是 1 小时或 30 分钟(或任何适合指定时区中时区转换的时间)。

于 2021-10-26T22:43:36.923 回答