0

为了确保良好的人口代表性,我从我的训练数据中创建了自定义验证集。但是,我不确定如何在 R 中的 PCR 中进行接口

我试图在分段参数中添加一个列表,其中每个索引类似于您在 python 预定义拆分 cv 迭代器中所做的操作,该迭代器运行但需要永远。所以我觉得我一定在某个地方犯了错误

 pcr(y~X,scale=FALSE,data=tdata,validation="CV",segments=test_fold)

其中 test fold 是包含属于索引的验证集的列表

例如,如果训练数据由 9 个样本组成,我想使用前三个作为儿子的第一个验证集

test_fold<-c(1,1,1,2,2,2,3,3,3) 

这运行但它非常慢,如果我执行常规“CV”,它会在几分钟内运行。到目前为止,结果看起来还不错,但是我需要进行一千多次跑步,并且需要 1 小时才能完成一次。因此,如果有人知道我如何加快速度,我将不胜感激。

4

1 回答 1

0

所以segments参数需要是多个向量的列表。因此,如果我希望前三个样本在第一个验证集中,接下来的三个在第二个验证集中等等,那么再次使用 9 个样本

test_vec<-list(c(1,2,3),c(4,5,6),c(7,8,9)) 
于 2019-03-27T20:39:17.043 回答