我正在构建一个决策树回归器。我的样本量约为 23K,我正在考虑叶子中的最小观察数应该是多少,以避免过度拟合。我正在研究 SAS Miner,它会自动构建默认值为 5 的树。但我不确定这是一个很好的阈值。我正在考虑是否将最小叶子大小设置为 50 或 100。我构建了不同的树并比较了它们,但它们并没有给我令人满意的结果。我想知道是否有最佳实践或常用的比率。
我正在构建一个决策树回归器。我的样本量约为 23K,我正在考虑叶子中的最小观察数应该是多少,以避免过度拟合。我正在研究 SAS Miner,它会自动构建默认值为 5 的树。但我不确定这是一个很好的阈值。我正在考虑是否将最小叶子大小设置为 50 或 100。我构建了不同的树并比较了它们,但它们并没有给我令人满意的结果。我想知道是否有最佳实践或常用的比率。