5

我是 tsibble 包的新手。我有每月数据,我强迫一个 tsibble 使用 fable 包。我遇到的几个问题

  • 即使我对它应用了 lubridate 的 ymd 函数,索引变量(来自我的测试)似乎也不是类日期。
  • has_gaps 函数返回 FALSE,但是当我对数据建模时,我收到“.data 包含隐式时间间隔”的错误
library(dplyr)
library(fable)
library(lubridate)
library(tsibble)

test <- data.frame(
   YearMonth = c(20160101, 20160201, 20160301, 20160401, 20160501, 20160601,
                 20160701, 20160801, 20160901, 20161001, 20161101, 20161201),
      Claims = c(13032647, 1668005, 24473616, 13640769, 17891432, 11596556,
                 23176360, 7885872, 11948461, 16194792, 4971310, 18032363),
     Revenue = c(12603367, 18733242, 5862766, 3861877, 15407158, 24534258,
                 15633646, 13720258, 24944078, 13375742, 4537475, 22988443)
)

test_ts <- test %>% 
  mutate(YearMonth = ymd(YearMonth)) %>% 
  as_tsibble(
    index = YearMonth,
    regular = FALSE       #because it picks up gaps when I set it to TRUE
    )

# Are there any gaps?
has_gaps(test_ts, .full = T)

model_new <- test_ts %>% 
  model(
  snaive = SNAIVE(Claims))
Warning messages:
1: 1 error encountered for snaive
[1] .data contains implicit gaps in time. You should check your data and convert implicit gaps into explicit missing values using `tsibble::fill_gaps()` if required.

任何帮助将不胜感激。

4

2 回答 2

5

你有一个每日索引,但你想要一个每月索引。最简单的方法是使用该tsibble::yearmonth()函数,但您需要先将日期转换为字符。

library(dplyr)
library(tsibble)

test <- data.frame(
  YearMonth = c(20160101, 20160201, 20160301, 20160401, 20160501, 20160601,
    20160701, 20160801, 20160901, 20161001, 20161101, 20161201),
  Claims = c(13032647, 1668005, 24473616, 13640769, 17891432, 11596556,
    23176360, 7885872, 11948461, 16194792, 4971310, 18032363),
  Revenue = c(12603367, 18733242, 5862766, 3861877, 15407158, 24534258,
    15633646, 13720258, 24944078, 13375742, 4537475, 22988443)
)

test_ts <- test %>%
  mutate(YearMonth = yearmonth(as.character(YearMonth))) %>%
  as_tsibble(index = YearMonth)
于 2019-12-31T04:03:25.907 回答
2

看起来as_tsibble无法正确识别YearMonth列中的间隔,因为它是一个Date类对象。它隐藏在帮助页面的“索引”部分中,这可能是个问题:

对于规则间隔的 tbl_ts,必须选择索引表示。例如,每月数据应对应于由 yearmonth 或 zoo::yearmon 创建的时间索引,而不是 Date 或 POSIXct。

就像那个摘录表明你可以解决这个问题yearmonth()。但这需要首先进行一些字符串操作才能将其转换为可以正确解析的格式。

test_ts <- test %>% 
  mutate(YearMonth = gsub("(.{2})01$", "-\\1", YearMonth) %>% 
           yearmonth()
         ) %>%
  as_tsibble(
    index = YearMonth
  )

现在模型应该可以无错误地运行了!不知道为什么has_gaps()测试在你的例子中说一切都很好......

于 2019-12-31T02:27:37.683 回答