0

我已经训练了一个 XGBoost 二元分类器,我想为我给模型的每个观察提取特征重要性(我已经有了全局特征重要性)。

更具体地说,我正在寻找一种方法来确定,对于给定模型的每个实例,哪些特征具有最大的影响,并使输入属于一个或另一个类。我想知道使观察结果属于某个类别的前 5 个特征,以及我应该如何修改这 5 个特征以降低或增加属于该类别的概率的指示。

例如,假设我的模型根据房屋的位置、表面和卧室数量来预测房屋的价格是否超过 100,000 美元(这是正类)。我给它以下输入:伦敦,400 平方英尺,4 间卧室,我的模型预测房子属于正类的概率为 56%。我正在寻找一个 Python 模块或一个函数,它可以为每个观察显示最有影响力的特征。

4

1 回答 1

2

有几种不同的方法。您可以使用 xgboost 库中的原生重要性度量。检查这个答案:https ://stackoverflow.com/a/51645066/3733974

您还可以寻找替代方法。这里有两个我可以推荐的:

于 2019-08-02T09:48:11.653 回答