我正在使用向量自回归 (VAR) 模型进行分析。我正在处理日期格式为 yyyy-mm-dd hh:mm:ss 的数据。但是我在网上找到的例子大多是YYYY-MM格式。
例子:
y1<- ts(y$y1, start= c(2020, 5), frequency = 12)
此外,我尝试使用的数据来自 twitter,并且信息在时间范围内不一致。此外,我确实检查以确保我没有重复的行。如何对以下格式的数据进行 VAR 分析?
这是为了创建一个tsibble
需要fable
以秒为分辨率并且每个时间点只有一行的 VAR:
library(tidyverse)
library(lubridate)
#>
#> Attaching package: 'lubridate'
#> The following objects are masked from 'package:base':
#>
#> date, intersect, setdiff, union
library(fable)
#> Loading required package: fabletools
tribble(
~Datetime, ~A, ~B, ~C,
"2014-02-27 17:28:11", 626, 0,0,
"2014-02-27 17:28:11", 626, 0,0,
"2014-02-19 14:16:20", 0,0,1
) %>%
mutate(Datetime = parse_datetime(Datetime, format = "%Y-%m-%d %H:%M:%z")) %>%
distinct(Datetime, .keep_all = TRUE) %>%
as_tsibble(index = Datetime)
#> # A tsibble: 2 x 4 [12h 12m] <UTC>
#> Datetime A B C
#> <dttm> <dbl> <dbl> <dbl>
#> 1 2014-02-18 18:16:00 0 0 1
#> 2 2014-02-27 06:28:00 626 0 0
由reprex 包(v2.0.1)于 2021-09-13 创建