我目前正在使用 R 通过使用随机森林回归进行特征选择。我想在 70:30 拆分我的数据,这很容易做到。但是,我希望能够这样做 10 次,每 10 次获得一组与之前不同的示例。
> trainIndex<- createDataPartition(lipids$RT..seconds., p=0.7, list=F)
> lipids.train <- lipids[trainIndex, ]
> lipids.test <- lipids[-trainIndex, ]
这就是我目前正在做的事情,它非常适合 70:30 拆分我的数据。但是当我再次这样做时,我在训练集中得到了相同的 70% 的数据,在我的测试数据中得到了相同的 30% 的数据。我知道这就是 createDataPartition 的工作原理,但是有没有办法让它在下次执行时获得不同的 70% 的数据?
谢谢