我正在研究一个研究问题,并且由于包含主题的小型数据集,我正在尝试实施 Leave N Out 样式分析。
目前我正在做这个临时的,我偶然发现了 scikit-learn LeavePGroupsOut 函数。
我阅读了文档,但无法理解如何在多维数组中使用它。
我的数据如下:我有 50 个主题,每个主题大约 20 个条目(不固定)和每个条目的 20 个特征,每个条目的真实值(0 或 1)。
我正在研究一个研究问题,并且由于包含主题的小型数据集,我正在尝试实施 Leave N Out 样式分析。
目前我正在做这个临时的,我偶然发现了 scikit-learn LeavePGroupsOut 函数。
我阅读了文档,但无法理解如何在多维数组中使用它。
我的数据如下:我有 50 个主题,每个主题大约 20 个条目(不固定)和每个条目的 20 个特征,每个条目的真实值(0 或 1)。