我正在使用 LibSVM 进行 3D 医学图像分割。我有一个包含 15 个患者病例的数据集。从每个患者病例中,我随机选择 1000 个体素作为样本。我对患者病例使用留一法交叉验证,这样就有 15 次学习测试。
在学习测试的每个过程中,我使用网格搜索方法找到最佳超参数 C 和 gamma。然而,网格搜索花费了太多的处理时间,以至于我无法使用更多的样本来进行训练测试。
我的问题是什么时候应该进行网格搜索以找到最佳超参数?
有朋友告诉我,我只需要在更改特征组合后重做网格搜索。但是,我对此并不感到安全。因为即使在 15 次学习测试中,我也能得到几对不同的最佳 C 和 gamma,这仅仅是训练样本的 1/14 部分差异造成的。
另一方面,考虑到过度拟合,我想知道是否有必要使用从训练数据集中获得的最佳超参数。我可以使用我在之前的实验中获得的超参数和一些不同的实验,而不是再次重做耗时的网格搜索吗?