0

属性已保存在 csv 文件的 11 列中。如果列的顺序发生变化,那么 Randomforest 和 RandomTree 每次都会给出不同的准确度吗?

4

1 回答 1

2

特征的排序不会影响我知道的任何分类器(除了那些专门设计用于这样做的分类器 - 例如用于时间序列和其他时间特征的专业分类器),无论它是神经网络、SVM、RandomForest、RandomTree 还是 NaiveBayes - 这只是一个数字简化,因为数组比集合更快,而“在引擎盖下”它们被视为无序集合(只有指示它来自哪个维度的索引)。

由于其概率/随机学习方法,每次运行代码时特定分类器的输出可能会发生变化。例如 - 神经网络具有随机初始化,RandomForests 具有随机子采样等。

所以答案令人惊讶的是“是的,它可以在列顺序改变后改变”,但原因不是顺序改变,而是事实上,在你这样做之后,内部随机数生成器已经通过了一些循环并将生成不同的数字。

于 2013-09-18T08:11:11.970 回答