0

我正在尝试计算 R 中 Germancredit 数据框的信用评分。我使用线性 SVM 分类器来预测 0 和 1(即 0 = 好,1 = 坏)。

我设法使用以下代码从 SVM 分类器中产生概率。

final_pred = predict(classifier, newdata = data_treated[1:npredictors], decision.values = TRUE, probability = TRUE)

probs = attr(final_pred,"probabilities")

我想知道如何阅读这些概率输出。示例输出在这里。以下输出是否意味着,如果第五行中的预测为 1(默认) ,则概率为 0.53601166。

              0          1 Prediction
1    0.90312125 0.09687875 0
2    0.57899408 0.42100592 0
3    0.93079172 0.06920828 0
4    0.76600082 0.23399918 0
5    0.46398834 0.53601166 1

然后我可以像我们通常使用逻辑回归模型那样使用上述各自的概率来开发信用评分卡吗

4

1 回答 1

1

您得到结果 0 或 1 的概率。每行的前两列总和为 1,并为您提供总体概率。您的解释对我来说似乎是正确的,即发生违约的可能性为 0.53,而不是 p = 0.46 时不发生违约的可能性。

是的,您可以使用该模型来开发信用记分卡。请注意,您不一定需要使用 0.5 作为您的截止值来决定公司或个人 X 是否会违约。

于 2020-10-23T07:21:05.243 回答