2

我在 R 中进行分类。我有一个称为 testD 的测试数据数据框和一个称为结果的数据数据框(这些是正确的分类值)。

这些数据帧非常大,在整个集合上训练我的模型需要很长时间,所以我想随机选择大约 5,000 个数据点并在此基础上进行训练。

我知道如何从任一数据框中随机选择 5,000 行,但我需要确切知道我从“testD”中选择了哪些行,以便知道“结果”中的哪些 5,000 行要进行比较。

任何帮助将不胜感激!

4

1 回答 1

9

你可以这样做:

indices = sample(NROW(testD), 5000)
testD.sample = testD[indices, ]
results.sample = results[indices, ]
于 2013-04-25T00:25:19.893 回答