0

我计划在回归任务中为超参数优化做一个 GridSearch。我有一个包含 37 个组的数据集,每组 100 到 300 个样本。一组的所有样本都分配有相同的标签。该模型将在 Leave-One-Group-Out 设计中进行训练。保留组样本的预测将是平均的。最终评估基于所有保留组预测(该组的样本预测的平均值)与组的真实值之间的 Spearman 相关性。

是否可以实现嵌套分组的 GridSearchCV?GridSearchCV 还应该对预测应用 GroupedKFold 交叉验证。我不确定如何实现整体模型中的评分功能(上图)。保留组的预测应根据各自样本预测的平均值计算,然后针对组标签进行评估(使用 spearman 相关性)。

4

0 回答 0