如何对以下示例数据框进行子集化以仅返回每个 ID 的最早出现 [即 min(year)] 的一个观察值?
id <- c("A", "A", "C", "D", "E", "F")
year <- c(2000, 2001, 2001, 2002, 2003, 2004)
qty <- c(100, 300, 100, 200, 100, 500)
df=data.frame(year, qty, id)
在上面的示例中,“A”id 在 2000 年和 2001 年有两个观察值。在重复 id 的情况下,我希望子集数据框仅包含第一次出现的观察值(即 2000 年)重复的 ID。
df2 = subset(df, ???)
这就是我要返回的内容:
df2
year qty id
2000 100 A
2001 100 C
2002 200 D
2003 100 E
2004 500 F
任何帮助将不胜感激。