我有一个非常大的数据集,如下所示:
df <- data.frame(school=c("a", "a", "a", "b","b","c","c","c"), year=c(3,3,1,4,2,4,3,1), GPA=c(4,4,4,3,3,3,2,2))
school year GPA
a 3 4
a 3 4
a 1 4
b 4 3
b 2 3
c 4 3
c 3 2
c 1 2
我希望它看起来像:
school year GPA
a 3 4
a 3 4
b 4 3
c 4 3
所以基本上,我想要的是每个给定的学校,我想要他们的高年级学生(学生),不管 GPA 是多少。
我试过了:
new_df <- df[!duplicated(paste(df[,1],df[,2])),]
但这给了我学校和年级之间的独特组合。
而下面的那个给了我独特的学校
new_df2 <- df[!duplicated(df$school),]