对于分类,我使用 Weka 的 J48 决策树在几个标称属性上构建模型。现在有更多用于分类的数据(5 个非小属性),但每个属性都有 3000 个不同的值。我使用带有修剪功能的 J48,但它的内存不足(相关的 4GB)。使用较小的数据集,我在输出中看到,J48 保留所有叶子,没有与之关联的实例。为什么将它们保留在模型中?我应该切换到另一种分类算法吗?
对于分类,我使用 Weka 的 J48 决策树在几个标称属性上构建模型。现在有更多用于分类的数据(5 个非小属性),但每个属性都有 3000 个不同的值。我使用带有修剪功能的 J48,但它的内存不足(相关的 4GB)。使用较小的数据集,我在输出中看到,J48 保留所有叶子,没有与之关联的实例。为什么将它们保留在模型中?我应该切换到另一种分类算法吗?