machine-learning - 使用 PDPBox 时显示掉落的假人

问问题 2021-02-04T11:05:24.837

25 次

我目前正在研究如何解释机器学习模型，我发现 PDPBox 包中的函数“pdp_plot”对于显示预测结果如何受到解释变量变化的影响非常有用。但是，我没有找到如何显示所有虚拟变量，包括在数据预处理步骤中删除的虚拟变量。

在我的初始数据集中，我有一个名为“Area”的解释变量，它有 6 个唯一值：A、B、C、D、E、F。在创建虚拟变量并删除第一列之后，用于训练我的 XGB 模型的数据集包括 Area_B ，区域_C，区域_D，区域_E，区域_F。

当使用 PDPBox 中的“pdp_isolate”和“pdp_plot”函数时，它显示了虚拟变量 Area_B = 1 的情况，然后是虚拟变量 Area_C = 1 的情况，然后是虚拟变量 Area_D = 1 的情况，等等。没有显示所有这些虚拟变量 = 0 的情况的结果。有人知道如何显示这个吗？

非常感谢您的时间。希望答案也对社区有所帮助。如果需要澄清，请联系！

machine-learning - 使用 PDPBox 时显示掉落的假人

0 回答 0

Related

Reference