0

我正在使用向量自回归 (VAR) 模型进行分析。我正在处理日期格式为 yyyy-mm-dd hh:mm:ss 的数据。但是我在网上找到的例子大多是YYYY-MM格式。

例子:

y1<- ts(y$y1, start= c(2020, 5), frequency = 12)

此外,我尝试使用的数据来自 twitter,并且信息在时间范围内不一致。此外,我确实检查以确保我没有重复的行。如何对以下格式的数据进行 VAR 分析? 在此处输入图像描述

4

1 回答 1

0

这是为了创建一个tsibble需要fable以秒为分辨率并且每个时间点只有一行的 VAR:

library(tidyverse)
library(lubridate)
#> 
#> Attaching package: 'lubridate'
#> The following objects are masked from 'package:base':
#> 
#>     date, intersect, setdiff, union
library(fable)
#> Loading required package: fabletools

tribble(
  ~Datetime, ~A, ~B, ~C,
  "2014-02-27 17:28:11", 626, 0,0,
  "2014-02-27 17:28:11", 626, 0,0,
  "2014-02-19 14:16:20", 0,0,1
) %>%
  mutate(Datetime = parse_datetime(Datetime, format = "%Y-%m-%d %H:%M:%z")) %>%
  distinct(Datetime, .keep_all = TRUE) %>%
  as_tsibble(index = Datetime)
#> # A tsibble: 2 x 4 [12h 12m] <UTC>
#>   Datetime                A     B     C
#>   <dttm>              <dbl> <dbl> <dbl>
#> 1 2014-02-18 18:16:00     0     0     1
#> 2 2014-02-27 06:28:00   626     0     0

reprex 包(v2.0.1)于 2021-09-13 创建

于 2021-09-13T08:43:03.990 回答