我想对数据框进行子集化,以仅包含具有三列唯一组合的行。我的情况与此问题中提出的情况相似,但我也想保留数据中的其他列。这是我的例子:
> df
v1 v2 v3 v4 v5
1 7 1 A 100 98
2 7 2 A 98 97
3 8 1 C NA 80
4 8 1 C 78 75
5 8 1 C 50 62
6 9 3 C 75 75
请求的输出将是这样的,我正在寻找仅基于 v1、v2 和 v3 的独特案例:
> df.new
v1 v2 v3 v4 v5
1 7 1 A 100 98
2 7 2 A 98 97
3 8 1 C NA 80
6 9 3 C 75 75
如果我能恢复非唯一的行,那也很棒:
> df.dupes
v1 v2 v3 v4 v5
3 8 1 C NA 80
4 8 1 C 78 75
5 8 1 C 50 62
我在 sql (这里)中看到了一个有关如何执行此操作的相关问题,但我无法在 R 中得到它。我确信这很简单,但搞乱 unique() 和 subset() 并没有取得成果。提前致谢。