我有一个包含两个数据级别的 R 数据框:id
和year
. 在由 定义的组内id
,年数增加(整个数据集每组的年数相同,如下所示:
id year var1 var2
11A 2001 ... ...
11A 2002 ... ...
11A 2003 ... ...
11A 2004 ... ...
13B 2001 ... ...
13B 2002 ... ...
13B 2003 ... ...
13B 2004 ... ...
22Z 2001 ... ...
我的数据中有大约 20.000 个组,当然太多了,无法绘制出漂亮的增长曲线图。如何随机选择大约 20 个我的 id?(所以:还选择与该 ID 对应的所有 4 行年份?)