1

我开始学习 R 和数据科学。

我有一个数据框,我的大部分变量和我想要预测的类都是离散的。

我需要做的是在这些数据中找到异常值,以便我可以通过插补或其他方式处理它们。

我研究的一些方法是使用 IQR(四分位间距)、Cook 距离或使用 'outliers' 包,但似乎大多数只能应用于连续数据,所以 R 给了我错误说它不能应用在这种情况下,我认为是离散数据。

我在使用“异常值”包时遇到的错误之一。

Error in Summary.factor(c(6L, 6L, 8L, 6L, 7L, 7L, 6L, 9L, 12L, 12L, 12L,  : 'max' not meaningful for factors

我在这里做错了吗?有人可以帮忙吗?任何帮助表示赞赏,谢谢。

4

0 回答 0