7

我正在使用 Catboost 并希望可视化 shap_values:

from catboost import CatBoostClassifier
model = CatBoostClassifier(iterations=300)
model.fit(X, y,cat_features=cat_features)

pool1 = Pool(data=X, label=y, cat_features=cat_features)
shap_values = model.get_feature_importance(data=pool1, fstr_type='ShapValues', verbose=10000)

shap_values.shape
Output: (32769, 10)
X.shape
Output: (32769, 9)

然后我执行以下操作并引发异常:

shap.initjs()
shap.force_plot(shap_values[0,:-1], X.iloc[0,:])

例外:在 v0.20 中 force_plot 现在需要将基值作为第一个参数!尝试 shap.force_plot(explainer.expected_value, shap_values) 或多输出模型尝试 shap.force_plot(explainer.expected_value[0], shap_values[0])。

以下工作,但我想让 force_plot() 工作:

shap.initjs()
shap.summary_plot(shap_values[:,:-1], X)

我阅读了文档,但无法理解解释器。我试过了:

explainer = shap.TreeExplainer(model,data=pool1)
#Also tried:
explainer = shap.TreeExplainer(model,data=X)

但我得到:TypeError: ufunc 'isnan' not supported for the input types,并且输入无法根据转换规则 ''safe'' 安全地强制转换为任何支持的类型

谁能指出我正确的方向?谢谢

4

2 回答 2

1

我遇到了与以下相同的错误-

例外:在 v0.20 中 force_plot 现在需要将基值作为第一个参数!尝试 shap.force_plot(explainer.expected_value, shap_values) 或多输出模型尝试 shap.force_plot(explainer.expected_value[0], shap_values[0])。

这帮助我解决了问题-

import shap
explainer = shap.TreeExplainer(model,data=X)
shap.initjs()
shap.force_plot(explainer.expected_value[0],X.iloc[0,:])

同样对于以下问题 -

TypeError: 输入类型不支持 ufunc 'isnan',并且根据转换规则 ''safe'' 无法安全地将输入强制转换为任何支持的类型

检查您的数据,如果它包含任何 NaN 或缺失值。
希望这可以帮助!

于 2020-05-25T02:08:05.370 回答
0

尝试这个:

shap.force_plot(explainer.expected_value, shap_values.values[0, :], X.iloc[0, :])
于 2021-07-13T18:46:46.530 回答