我在 R 中进行分类。我有一个称为 testD 的测试数据数据框和一个称为结果的数据数据框(这些是正确的分类值)。
这些数据帧非常大,在整个集合上训练我的模型需要很长时间,所以我想随机选择大约 5,000 个数据点并在此基础上进行训练。
我知道如何从任一数据框中随机选择 5,000 行,但我需要确切知道我从“testD”中选择了哪些行,以便知道“结果”中的哪些 5,000 行要进行比较。
任何帮助将不胜感激!
我在 R 中进行分类。我有一个称为 testD 的测试数据数据框和一个称为结果的数据数据框(这些是正确的分类值)。
这些数据帧非常大,在整个集合上训练我的模型需要很长时间,所以我想随机选择大约 5,000 个数据点并在此基础上进行训练。
我知道如何从任一数据框中随机选择 5,000 行,但我需要确切知道我从“testD”中选择了哪些行,以便知道“结果”中的哪些 5,000 行要进行比较。
任何帮助将不胜感激!