我有一个包含 3 个变量的 167 个观察值的数据集。我正在尝试使用稳健的马氏距离来评估和消除多元异常值。为此,我一直在使用包中的Moutlier
功能chemometrics
。
我对 R 很陌生,所以我有一些问题:
这是我的代码:
data<-isotopes
x=data[,c(3:5)] #columns 3-5 contain the data I need to assess
require(robustbase)
res <- Moutlier(data[,c(3:5)] ,quantile=0.975,plot=TRUE)
res
which(res$rd>res$cutoff)
1)以前有人用过这个代码吗,我做对了吗?
2)在做这个功能之前我需要对数据进行标准化,还是没有关系?
3)使用该which
函数后,结果为:
# [1] 13 28 29 47 79 84 89 91 104 128 153 154
这是否意味着这些数字对应于观察 #13、#28、#29 等?
那么对于所有 3 个变量,这些将是我要删除的异常值吗?
非常感谢任何可以提供帮助的人...