0

我想用 r 开发一个cox 比例风险模型,用它来预测输入并评估模型的准确性。对于评估,我想使用Brior score

# import various packages, needed at some point of the script
library("survival")
library("survminer")
library("prodlim")
library("randomForestSRC")
library("pec")
library("rpart")
library("mlr")
library("Hmisc")
library("ipred")

# load lung cancer data
data("lung")
head(lung)

# recode status variable 
lung$status <- lung$status-1

# Delete rows with missing values
lung <- na.omit(lung)

# split data into training and testing
## 80% of the sample size
smp_size <- floor(0.8 * nrow(lung))

## set the seed to make your partition reproducible
set.seed(123)
train_ind <- sample(seq_len(nrow(lung)), size = smp_size)

# training and testing data
train.lung <- lung[train_ind, ]
test.lung <- lung[-train_ind, ]

# time and failure event
s <- Surv(train.lung$time, train.lung$status)
# create model
cox.ph2 <- coxph(s~age+meal.cal+wt.loss, data=train.lung)

# predict 
pred <- predict(cox.ph2, newdata = train.lung)

# evaluate 
sbrier(s, pred) 

作为预测的结果,我期望时间(如“这个个体何时经历失败)。相反,我得到这样的值

[1]  0.017576359 -0.135928959 -0.347553969  0.112509137 -0.229301199 -0.131861582  0.044589175  0.002634008
[9]  0.345966978  0.209488560  0.002418358  

这意味着什么?

此外,sbrier 不起作用。显然它不能与预测 pred 一起工作(这并不奇怪)

我该如何解决这个问题?如何使用 cox.ph2 进行预测?之后如何评估模型?

4

1 回答 1

2

predict()函数不会返回时间值,您必须type = c("lp", "risk","expected","terms","survival")predict()函数中指定参数。

如果您想获得风险比:

predict(cox.ph2, newdata = test.lung, type = "risk")

请注意,您要预测测试集而不是训练集上的值。

我已经读到您可以在您的情况下使用 AFT 模型: https ://stats.stackexchange.com/questions/79362/how-to-get-predictions-in-terms-of-survival-time-from-a-cox -ph模型

您还可以阅读这篇文章: 使用 R 中的 Cox Proportional Hazard 模型计算生存预测

希望它会有所帮助

于 2018-06-05T11:05:54.857 回答