0

在 Azure ML 中训练决策树时,是否可以查看每个功能的熵/信息增益?

4

1 回答 1

1

传统节点性能:

您目前只能在增强的决策树模型中查看 gini 的相对增益。右键单击并可视化经过训练的增强决策树的输出,图片链接如下。从那开始,等待树木加载。然后,您可以单击每个单独树的节点以查看每个级别的拆分增益。

每个节点的分裂增益

熵/信息增益:

虽然让我们退后一步,问我们为什么要查看熵?熵是单个树中节点特定的度量。Azure 机器学习没有单一的树分类器,例如 R 中的 rpart,只有决策森林、决策丛林和增强决策树模块形式的树集合。

变量重要性:

因此,我猜您正在寻找变量/特征重要性测量值,它是集合内所有树中所有节点拆分的整体基尼系数/熵/信息增益的聚合或平均值。Azure ML 有一个模块,该模块通过称为排列特征重要性模块的经过训练的算法计算特征重要性。它通过在您的训练模型中运行随机预测值来查看响应类别变化的幅度。

置换特征重要性模块

于 2016-03-15T00:10:13.657 回答