1

我对生存分析很陌生,所以我的问题对你们大多数人来说可能很幼稚,我很抱歉。

我有一些左右审查的遥测数据。

我首先必须估计 3 个虚拟解释变量对生存的影响,所以我使用了 Anderson-Gill 模型(Cox 模型的扩展)。在这里,危害是性别、研究区域(地区)和年龄等级(年龄分为 3 个年龄等级:小猫(0-1 岁)、一岁(1-2 岁)和成人(2 岁以上))的函数。主要的“问题”是年龄类变量是一个时间相关的协变量。一些人在几年内被跟踪,因此在研究期间改变了年龄等级。该模型的输出提供了我正在测试的每个变量对生存(性别、地区和年龄类别)的影响。我可以很容易地预测生存率 (S(t)),survfit()并预测了代表群组的曲线,这些群组的协变量对应于 newdata 中的值。

我的最终目标是估计每个队列(即来自北部地区的成年男性)的平均年存活率,以便将这些估计值用作年龄结构矩阵人口模型的输入。我最初想对我从survfit()函数中得到的生存估计 S(t) 做一个简单的平均,但后来我意识到时间相关的协变量似乎使估计变得更加复杂。我什至想知道是否可以使用 Cox 模型估计每个队列的平均年生存率。也许每年的 Kaplan-Meier 生存估计应该可以解决问题?是否有可能从 获得它survfit()

有人已经不得不做同样的分析了吗?这是总结我为估计每个协变量的影响所做的 R 代码:

 #create a surv object in order to adjust a Cox model on dataset
mydata.surv <- Surv(mydata$START,mydata$END, mydata$STATE) 

 # Andersen-Gill model
fit <- cph(formula = mydata.surv~SEX+AGE_CLASS+STUDYAREA, data=mydata, 
           method=c("exact"), se.fit=T, linear.predictors=TRUE,  
           x=T, y=T, surv="summary")

 #create new dataset in order to predict survival
newdata <- expand.grid(AGE_CLASS=c(1,2,3),SEX=c("M","F"),
                   STUDYAREA=c("north","mid","south"))  

 #predict survival for each cohorts
out <- summary(survfit(fit, newdata = newdata , type = "breslow")) 
4

1 回答 1

0

我认为这个问题可能应该转到交叉验证。但这是我的看法:您应该使用逻辑回归模型。一旦受试者存活了一定时间,他们就不会被审查,但你观察到失败,他们会在新的年龄重新进入队列。它们不是独立的,除非生存过程有条件地无记忆(一个复杂的鞅属性,与统计无关,因为它是一个不可能测试的假设)。您可以通过观察每个受试者的特定生存间隔来构建独立样本。将这些结果与将每个受试者特定年龄间隔视为独立数据的伪似然进行比较,然后检查随机效应模型并验证随机截距的方差与固定效应的 95% CI 相比相对较小。

于 2018-01-16T17:59:39.497 回答