我对生存分析很陌生,所以我的问题对你们大多数人来说可能很幼稚,我很抱歉。
我有一些左右审查的遥测数据。
我首先必须估计 3 个虚拟解释变量对生存的影响,所以我使用了 Anderson-Gill 模型(Cox 模型的扩展)。在这里,危害是性别、研究区域(地区)和年龄等级(年龄分为 3 个年龄等级:小猫(0-1 岁)、一岁(1-2 岁)和成人(2 岁以上))的函数。主要的“问题”是年龄类变量是一个时间相关的协变量。一些人在几年内被跟踪,因此在研究期间改变了年龄等级。该模型的输出提供了我正在测试的每个变量对生存(性别、地区和年龄类别)的影响。我可以很容易地预测生存率 (S(t)),survfit()
并预测了代表群组的曲线,这些群组的协变量对应于 newdata 中的值。
我的最终目标是估计每个队列(即来自北部地区的成年男性)的平均年存活率,以便将这些估计值用作年龄结构矩阵人口模型的输入。我最初想对我从survfit()
函数中得到的生存估计 S(t) 做一个简单的平均,但后来我意识到时间相关的协变量似乎使估计变得更加复杂。我什至想知道是否可以使用 Cox 模型估计每个队列的平均年生存率。也许每年的 Kaplan-Meier 生存估计应该可以解决问题?是否有可能从 获得它survfit()
?
有人已经不得不做同样的分析了吗?这是总结我为估计每个协变量的影响所做的 R 代码:
#create a surv object in order to adjust a Cox model on dataset
mydata.surv <- Surv(mydata$START,mydata$END, mydata$STATE)
# Andersen-Gill model
fit <- cph(formula = mydata.surv~SEX+AGE_CLASS+STUDYAREA, data=mydata,
method=c("exact"), se.fit=T, linear.predictors=TRUE,
x=T, y=T, surv="summary")
#create new dataset in order to predict survival
newdata <- expand.grid(AGE_CLASS=c(1,2,3),SEX=c("M","F"),
STUDYAREA=c("north","mid","south"))
#predict survival for each cohorts
out <- summary(survfit(fit, newdata = newdata , type = "breslow"))