我正在尝试格式化数据集以用于某些生存分析模型。每行是一所学校,时变列是当年该校在校学生总数。假设数据框看起来像这样(也有时间不变的列)。
Name total.89 total.90 total.91 total.92
a 8 6 4 0
b 1 2 4 9
c 7 9 0 0
d 2 0 0 0
我想创建一个新列,指示学校何时“死亡”,即出现零的第一列。最终,我希望这个专栏是“自 1989 年以来的年份”,并且可以相应地重新命名专栏。
该问题的更一般版本,对于一系列时间排序的列,我如何识别出现给定值的第一列?