我有一个非常简单的数据集:
ID Value Time
1 censored 1
1 censored 2
1 uncensored 3
1 uncensored 4
1 censored 5
1 censored 6
2 censored 1
2 uncensored 2
2 uncensored 3
2 uncensored 4
2 censored 5
我想保留第一次uncensored
出现,并且我想在第一次censored
出现之后保留第一次出现uncensored
。例如:
ID Value Time
1 uncensored 3
1 censored 5
2 uncensored 2
2 censored 5
并非每个人的第一个审查日期都在时间 5,这只是一个例子。
Value
是一个二进制变量:1 表示审查,0 表示未审查,但我已经标记了它们。