我在 H2O 中使用 xgboost 进行二进制分类任务。数据集有几个分类特征,模型在训练期间对其应用单热编码。
现在我想使用 SHAP ( https://github.com/slundberg/shap ) 在本地解释预测。为此,最好让数据帧具有一次性编码的列和值。但是,我似乎无法从 H2O 模型中得到这个。
我可能可以手动重新创建一次性编码,但也许有人知道更快的解决方案?
我在 H2O 中使用 xgboost 进行二进制分类任务。数据集有几个分类特征,模型在训练期间对其应用单热编码。
现在我想使用 SHAP ( https://github.com/slundberg/shap ) 在本地解释预测。为此,最好让数据帧具有一次性编码的列和值。但是,我似乎无法从 H2O 模型中得到这个。
我可能可以手动重新创建一次性编码,但也许有人知道更快的解决方案?
我们已经为此开放了一段时间的票,但由于对该功能的需求增加,我们将很快重新访问。现在,您必须使用该方法将 H2OFrame 转换为 Pandas DataFrame as_data_frame()
,然后应用以下解决方案之一。