我创建了一个特征向量(data.frame),它有一个 id、feat1、feat2、feat3、boolean,但是在这个数据框中有重复的 id,这是有目的的。我想要做的是当我遍历这个数据框时,为每个 id 构建新的数据框。
为简单起见,假设我有以下两列。
X1 X2 X3
1 000000001 -1.4061361 1
2 000000001 -0.1973846 1
3 000000002 -0.4385071 1
4 000000001 -0.6593677 0
5 000000001 -1.2592415 0
6 000000001 -0.5463655 1
7 000000002 0.4231117 0
8 000000002 -0.1640883 1
9 000000002 0.7157506 0
10 000000002 2.3234110 1
我想基于 X1 构建不同的数据框基本上我想将所有相同的 X1 放入他们自己的数据框。我使用多个 for 循环编写,但由于这是一个大型数据集,因此需要很长时间。做这个的最好方式是什么?