我正在尝试使用随机森林包在 R 中进行分类。
列出的变量重要性度量是:
- 第 0 类变量 x 的平均原始重要性得分
- 第 1 类变量 x 的平均原始重要性得分
MeanDecreaseAccuracy
MeanDecreaseGini
现在我知道这些“意味着”是什么,就像我知道它们的定义一样。我想知道的是如何使用它们。
我真正想知道的是,这些值仅在它们的准确程度、什么是好值、什么是坏值、最大值和最小值等方面意味着什么。
如果一个变量有一个高值,MeanDecreaseAccuracy
或者MeanDecreaseGini
这意味着它是重要的还是不重要的?此外,有关原始分数的任何信息也可能很有用。我想知道与这些数字的应用相关的所有信息。
使用“错误”、“求和”或“置换”等词的解释比不涉及任何讨论随机森林如何工作的更简单的解释更有帮助。
就像我希望有人向我解释如何使用收音机一样,我不希望解释涉及收音机如何将无线电波转换为声音。