我正在尝试将数据拆分为训练(80%)和测试(20%)集,但我需要先对数据进行洗牌,然后为每个数据集中的每个标签(y,10 个类)分配相等数量的样本。
我怎样才能在 lua/火炬中做到这一点?谢谢!
到目前为止,这是我的代码...
loaded = torch.load(data_file, 'ascii')
Data = {
data = loaded.data,
labels = loaded.labels,
size = 60000
}
Data.data:nDimension()
4
Data.labels:nDimension()
1
Data.data:size()
60000
1
32
32
[torch.LongStorage of size 4]
validationData.labels:size()
60000
[torch.LongStorage of size 1]