我有一个数据集,它有 ~60 列和 ~75000 行。我使用隔离森林模型来检测一些异常值并绘制 shap plot 以查看这些隔离森林的主要特征。
我的问题是:是否可以使用 shap 值作为删除值的阈值?就像如果我为某些变量设置 shap 值的级别,如果 shap 值 > 或 < 阈值,它们将被确定为异常值并且可以被删除。这是可执行的吗?如果是这样,我该如何在python中做到这一点?
我有一个数据集,它有 ~60 列和 ~75000 行。我使用隔离森林模型来检测一些异常值并绘制 shap plot 以查看这些隔离森林的主要特征。
我的问题是:是否可以使用 shap 值作为删除值的阈值?就像如果我为某些变量设置 shap 值的级别,如果 shap 值 > 或 < 阈值,它们将被确定为异常值并且可以被删除。这是可执行的吗?如果是这样,我该如何在python中做到这一点?