r - RDA 和超参数随机搜索的过度拟合结果？

翻译自：https://stackoverflow.com/questions/69669586 2021-10-21T22:50:10.093

20 次

我正在尝试使用正则化判别分析而不是传统的线性判别分析，因为我的数据显示异方差性和不相等的组大小。为了找到允许更高成功率的最佳 lambda 和 gamma 值，我使用了该caret软件包。然而，一位同事表示，这样做意味着由于过度拟合，成功率可能会被人为夸大。据我所知，当我在 caret 包中定义 trainControl 的参数时，我定义了一个交叉验证方法，这有助于处理过度拟合。我对吗？

这是我的数据和代码的示例：

set.seed(1337)
        cv_5_rand <- trainControl(method = "cv", number = 5, search = "random")
        
        fit.rda <- train(groups ~ ., data = data, method = "rda",
        trControl = cv_5_rand, tuneLength = 500)                
        Hp <- as.data.table(fit.rda$results)
        Hp <- Hp %>% arrange (desc(Accuracy))

据我所知，当我在 caret 包中定义 trainControl 的参数时，我定义了一个交叉验证方法，这有助于处理过度拟合。我对吗？

r - RDA 和超参数随机搜索的过度拟合结果？

0 回答 0

Related

Reference