1

我在我的数据集上使用了 LSTM 神经网络(Keras 包),并希望使用与模型无关的方法来查找变量对我的预测的影响。数据集是一个具有三个维度的数组。我有多个 ID,每个 ID 都有自己的序列,每个 ID 都有可变的时间步长。我的数据集的形状如下所示:(18610, 151, 18)(ID、时间步长、变量),一个时间步长上一个 ID 的变量输出如下所示(预测类 1):

[2.00000000e+00 0.00000000e+00 2.10544316e-03 1.56082309e-03
 0.00000000e+00 1.01647775e-01 0.00000000e+00 4.28571559e-01
 6.95422174e-01 8.52459016e-01 1.20027614e-01 1.00000000e+00
 0.00000000e+00 0.00000000e+00 0.00000000e+00 0.00000000e+00
 0.00000000e+00 1.00000000e+00] 1

所有模型不可知论方法(据我所知)都不适用于这些具有三个维度的数组数据集。有没有办法仍然找到变量的影响(使用 Lime、部分依赖图或 Shapley?)所以我可以解释模型?我更喜欢使用部分依赖图来查看全局解释。

有谁知道如何做到这一点(使用示例代码)?非常感谢您!

4

1 回答 1

0

我不确定您需要模型不可知方法的目的是什么,但我使用一种用于特征排名。您的数据(18610、151、18)的形状是 3D。您可以使用与模型无关的 SHAP 方法,它非常适合您的数据。

于 2021-08-13T12:25:58.230 回答