我正在使用 Weka 对二进制数据集进行分类。我想RandomForest
用作分类器。我发现RandomForest
有许多属性。我想知道这些属性的含义以及它们在分类时是如何工作的。Weka 分享了一些详细信息,可以从 的属性窗口的更多选项卡中找到RandomForest
。
我附上截图
这些属性有一些定义:
bagSizePercent -- 每个包的大小,作为训练集大小的百分比。
numIterations -- 随机森林中的树数。
outputOutOfBagComplexityStatistics -- 执行袋外评估时是否输出基于复杂性的统计信息
numFeatures -- 设置随机选择的属性的数量。如果为 0,则使用 int(log_2(#predictors) + 1)。
等等。
所以那些 1 行无法清除我的疑问。如果有人通过分享属性的深入视图来帮助我,那将非常有帮助。