是否可以将 RandomForests 应用于非常小的数据集?我有一个包含许多变量的数据集,但每个变量只有 25 个观察值。随机森林产生合理的结果,OOB 错误低 (10-25%)。关于使用的最少观察次数是否有任何经验法则?事实上,其中一个响应变量是不平衡的,如果我要对它进行二次抽样,我最终会得到更少的观察结果。提前致谢
问问题
15185 次
是否可以将 RandomForests 应用于非常小的数据集?我有一个包含许多变量的数据集,但每个变量只有 25 个观察值。随机森林产生合理的结果,OOB 错误低 (10-25%)。关于使用的最少观察次数是否有任何经验法则?事实上,其中一个响应变量是不平衡的,如果我要对它进行二次抽样,我最终会得到更少的观察结果。提前致谢