我是 R 新手,我有一个包含 500000 个患者 ID、日期和其他变量条目的数据框。
如果他们恰好在他们第一次出现的一年内出现,我想删除任何重复的重复患者 ID(PtID)。例如:
PtID date**
1. 1 01/01/2006
2. 2 01/01/2006
3. 1 24/02/2006
4. 4 26/03/2006
5. 1 04/05/2006
6. 1 05/05/2007
在这种情况下,我想删除第 3 和第 5 行并保留第 1 和第 6 行..
有人可以帮我解决这个问题..这是str(我的数据称为final1)
str(final1)
'data.frame': 605870 obs. of 70 variables:
...
$ Date : Date, format: "2006-03-12" "2006-04-01" ...
$ PtID : int 11251 11251 11251 11251 11251 11251 11251 30938 30938 11245 ...
...