0

我目前正在研究如何解释机器学习模型,我发现 PDPBox 包中的函数“pdp_plot”对于显示预测结果如何受到解释变量变化的影响非常有用。但是,我没有找到如何显示所有虚拟变量,包括在数据预处理步骤中删除的虚拟变量。

在我的初始数据集中,我有一个名为“Area”的解释变量,它有 6 个唯一值:A、B、C、D、E、F。在创建虚拟变量并删除第一列之后,用于训练我的 XGB 模型的数据集包括 Area_B ,区域_C,区域_D,区域_E,区域_F。

当使用 PDPBox 中的“pdp_isolate”和“pdp_plot”函数时,它显示了虚拟变量 Area_B = 1 的情况,然后是虚拟变量 Area_C = 1 的情况,然后是虚拟变量 Area_D = 1 的情况,等等。没有显示所有这些虚拟变量 = 0 的情况的结果。有人知道如何显示这个吗?

非常感谢您的时间。希望答案也对社区有所帮助。如果需要澄清,请联系!

4

0 回答 0