我正在尝试使用正则化判别分析而不是传统的线性判别分析,因为我的数据显示异方差性和不相等的组大小。为了找到允许更高成功率的最佳 lambda 和 gamma 值,我使用了该caret
软件包。然而,一位同事表示,这样做意味着由于过度拟合,成功率可能会被人为夸大。据我所知,当我在 caret 包中定义 trainControl 的参数时,我定义了一个交叉验证方法,这有助于处理过度拟合。我对吗?
这是我的数据和代码的示例:
set.seed(1337)
cv_5_rand <- trainControl(method = "cv", number = 5, search = "random")
fit.rda <- train(groups ~ ., data = data, method = "rda",
trControl = cv_5_rand, tuneLength = 500)
Hp <- as.data.table(fit.rda$results)
Hp <- Hp %>% arrange (desc(Accuracy))
据我所知,当我在 caret 包中定义 trainControl 的参数时,我定义了一个交叉验证方法,这有助于处理过度拟合。我对吗?