1

我正在使用来自库 (MASS) 的数据 (birthwt),我想在 Lasso 模型中使用 R 计算 Mathews 相关系数 (MCC)。我真的很困惑。提前致谢

birthwt=birthwt[,-10]
boot=sample(nrow(birthwt), 40)
train.data=birthwt[-boot, ]
test.data=birthwt[boot, ]
x =model.matrix(low~., train.data)[,-1]
y =train.data$low

套索模型:

library(glmnet)
set.seed(123)
cv.lasso = cv.glmnet(x, y, alpha = 1, family = "binomial")
model.lasso=glmnet(x,y,alpha=1,family="binomial",lambda= cv.lasso$lambda.min)
coef(model.lasso)
 x.test = model.matrix(low ~., test.data)[,-1]
proba.lasso = predict(model.lasso,newx = x.test)
class.lasso = ifelse(proba.lasso > 0.5, 1, 0)
class.obs = test.data$low
4

1 回答 1

0

如果您确实对 glmnet 对象进行预测,则默认响应是 logit 链接,但在您的情况下,您需要执行以下操作:

class.lasso = predict(model.lasso,newx = x.test,type="class")
class.lasso = as.numeric(class.lasso)
class.obs = test.data$low

您也可以这样使用概率:

class.lasso = ifelse(predict(model.lasso,newx = x.test,type="response") > 0.5,1,0)

要计算 mcc,您可以执行以下操作:

library(mltools)
mcc(pred = class.lasso, actual = class.obs)
[1] 0.2581989

或者使用计算皮尔逊 phi 的东西:

library(psych)
phi(table(class.lasso,class.obs),digits=7)

[1] 0.2581989

或者,如果您使用wiki 中的公式从头开始导出它:

cm = table(class.lasso,class.obs)
TP = cm[2,2]
FP = cm[2,1]
TN = cm[1,1]
FN = cm[1,2]

(TP * TN - FP*FN)/sqrt((TP+FP)*(TP+FN)*(TN+FP)*(TN+FN))
[1] 0.2581989
于 2021-02-13T19:38:12.817 回答