1

我习惯于使用 R 中的 qcc 包来检测数据中的异常值。我最近遇到了 AnomalyDetection 包。在这里找到:https ://github.com/twitter/AnomalyDetection

我的数据集如下:

date_start<-as.Date(c('2017-10-17','2017-10-18',
                '2017-10-19','2017-10-20',
                '2017-10-21','2017-10-22',
                '2017-10-23','2017-10-24',
                '2017-10-25','2017-10-26',
                '2017-10-27','2017-10-28',
                '2017-10-29','2017-10-30',
                '2017-10-31','2017-11-01',
                '2017-11-02','2017-11-03',
                '2017-11-04','2017-11-05',
                '2017-11-06','2017-11-07',
                '2017-11-08','2017-11-09',
                '2017-11-10','2017-11-11',
                '2017-11-12'))

count <- c(NA, 3828,
                3532,3527,
                3916,4303,
                3867,3699,
                3439,3099,
                3148,3310,
                3904,3525,
                2962,3398,
                2935,3013,
                3005,3516,
                3010,2848,
                2689,2573,
                2569,2946,
                2713)

df<-data.frame(date_start,count)

head(df)

  date_start count
1 2017-10-17    NA
2 2017-10-18  3828
3 2017-10-19  3532
4 2017-10-20  3527
5 2017-10-21  3916
6 2017-10-22  4303

当我使用 AnomalyDetection 包测试此数据集时,响应为 NULL,并且没有显示任何绘图。知道为什么会这样吗?

library(AnomalyDetection)
res = AnomalyDetectionTs(df, max_anoms=0.02, direction='both', plot=TRUE)
res$plot

NULL
4

2 回答 2

2

这是由于没有检测到异常情况造成的。

手动更改时:

count[13] <- 5671 

它被检测到。

此外,为了使情节正常工作,时间戳需要是类POSIXct

df <- data.frame(date_start = as.POSIXct(date_start),
                 count)

res <- AnomalyDetectionTs(df,
                          max_anoms = 0.02,
                          direction = 'both',
                          plot = TRUE)  

#output

$anoms
            timestamp anoms
1 2017-10-29 02:00:00  5671

$plot

在此处输入图像描述

于 2018-01-22T17:41:51.143 回答
-2

使用 POSIXct 时出现以下错误“错误:列x是日期/时间,必须存储为 POSIXct,而不是 POSIXlt”

但是更改为 POSIXlt 可以解决问题

于 2018-09-02T11:19:39.077 回答