1

我有一个包含 3 个变量的 167 个观察值的数据集。我正在尝试使用稳健的马氏距离来评估和消除多元异常值。为此,我一直在使用包中的Moutlier功能chemometrics

我对 R 很陌生,所以我有一些问题:

这是我的代码:

data<-isotopes  
  x=data[,c(3:5)] #columns 3-5 contain the data I need to assess  
  require(robustbase)  
  res <- Moutlier(data[,c(3:5)] ,quantile=0.975,plot=TRUE)  
  res  
  which(res$rd>res$cutoff) 

1)以前有人用过这个代码吗,我做对了吗?

2)在做这个功能之前我需要对数据进行标准化,还是没有关系?

3)使用该which函数后,结果为:

# [1]  13  28  29  47  79  84  89  91 104 128 153 154 

这是否意味着这些数字对应于观察 #13、#28、#29 等?
那么对于所有 3 个变量,这些将是我要删除的异常值吗?

非常感谢任何可以提供帮助的人...

4

0 回答 0