1

我正在尝试在 Windows 上的 SystemML 独立版本上运行决策树(https://github.com/apache/incubator-systemml/blob/master/scripts/algorithms/decision-tree.dml),但我一直收到错误“节点 1.0 的样本数量不能减少到匹配 10。这个节点被声明为叶子!”。似乎代码没有计算任何拆分,尽管我可以通过 R 执行树。以前有没有人使用过这个算法并且有一些关于如何解决错误的提示?谢谢

4

1 回答 1

1

此消息通常表明对最佳分类或比例特征的拆分不会带来任何额外收益。

我建议

  1. 调查计算的增益 (best_cat_gain, best_scale_gain)

  2. 仔细检查元数据(num_cat_features、num_scale_features)是否被正确识别。

您可以简单地在脚本中添加额外的打印语句来做到这一点。如果元数据无效,您可能需要检查可选输入 R 是否具有正确的布局,如脚本标题中所述。

如果这没有帮助,请分享输入参数、输入数据的格式等,我们将仔细研究。

于 2016-08-03T05:47:14.570 回答