我在这里有一个先前的问题,我认为我遇到了一个问题,因为我不能同时洗牌样本数据和样本数据的索引(idx)。
我有一个名为fulldata
的数据集,其中包含 49,000 行 x 6 列,然后我有另一个数据集,它是 fulldata (Book2) 的类标签,其中包含许多类标签,它们对应于 fulldata 中的确切行。
我只想从 fulldata(正常。和 smurf。)中选择两个类标签,我想要 750 个正常行和 250 个 smurf 行。
然后我想随机打乱新的样本数据(1000x6)。
到此为止,已被管理。但是后来我被卡住了... Dan 帮助解决了上一个问题,但后来我注意到 k1 输出了 Book2 中的一些其他类标签,例如海王星等,但事实并非如此... K1 应该只包含 smurf 和 normal 类标签。
我问这个的原因是因为我想在matlab中使用baysian分类器,为了使用它我需要:
Test_Data (unseen data)
Trainning_data (This is the sample data im trying to create above)
Target_class (this is the class labels that match exactly each row in sample data)