-1

我正在做一个项目,我需要为从我的机器学习模型中获得预测的每个数据行提供一个原因。我正在使用逻辑回归模型(二元分类)来获得我的预测,并且截止阈值为 0.6。我曾尝试使用 SHAP 和 ELI5 来识别最重要的特征,但这适用于所有数据点。我想为每个数据点说明它被归类为 1 的原因。我不确定如何使其在本地可解释以供人类理解预测。

4

1 回答 1

0

我认为它可以有一些假设:

1. we use LR instead of NN
2. each variable "X" treated as binary variable

对于 LR 方程:

y = 1/1+exp(-wi*xi)

由于 xi 属于 {0, 1},我们可以将 w_i 视为特征重要性。

对于你提到的每个实例,我们可以通过 w_i 对 x_i 进行排名,并找出该实例中的 x_i 是 0 还是 1。然后应该使用前 10 个(可能是 50 个)x_i 进行解释。

于 2020-04-20T09:58:04.040 回答