Ciao,我有学生辍学的数据,我的目标是进行生存分析,我认为可以检查或预测给定年级的辍学概率。然而,挑战是我想将成绩组合在一起,例如 (7,8) (9,10) (11,12)
这是我的复制示例。这是我现在拥有的数据:
data <- data.frame(STUDENT=c(1,1,1,1,2,2,2,2,3,3,3,3),
GRADE=c(9,10,11,12,7,8,9,10,9,10,11,12),
DROPOUT=c(0,0,0,0,0,0,1,1,0,0,0,1))
我使数据很高,例如 STUDENT=1 从未辍学,STUDENT=2 在 9 年级辍学,STUDENT=3 在 12 年级辍学。
现在这是我的基本生存分析方法
attach(data)
survivalmodel <- Surv(time=GRADE,event=DROPOUT)
我需要 time2 = 吗?你能说拥有它有多重要以及如何衡量它吗?我是自学的,还在读书。
所以我的问题是我如何获得 GRADE Bands (7,8) (9,10) (11,12) 的辍学概率,以便最终有学生在 9 年级和 10 年级分别退出 7 年级和 8 年级的概率11 年级和 12 年级分开。