我在我的数据集上使用了 LSTM 神经网络(Keras 包),并希望使用与模型无关的方法来查找变量对我的预测的影响。数据集是一个具有三个维度的数组。我有多个 ID,每个 ID 都有自己的序列,每个 ID 都有可变的时间步长。我的数据集的形状如下所示:(18610, 151, 18)(ID、时间步长、变量),一个时间步长上一个 ID 的变量输出如下所示(预测类 1):
[2.00000000e+00 0.00000000e+00 2.10544316e-03 1.56082309e-03
0.00000000e+00 1.01647775e-01 0.00000000e+00 4.28571559e-01
6.95422174e-01 8.52459016e-01 1.20027614e-01 1.00000000e+00
0.00000000e+00 0.00000000e+00 0.00000000e+00 0.00000000e+00
0.00000000e+00 1.00000000e+00] 1
所有模型不可知论方法(据我所知)都不适用于这些具有三个维度的数组数据集。有没有办法仍然找到变量的影响(使用 Lime、部分依赖图或 Shapley?)所以我可以解释模型?我更喜欢使用部分依赖图来查看全局解释。
有谁知道如何做到这一点(使用示例代码)?非常感谢您!