当我使用.fit()
图层训练模型时,参数 shuffle 预设为 True。
假设我的数据集有 100 个样本,批量大小为 10。当我设置时shuffle = True
,keras 首先随机选择样本(现在 100 个样本具有不同的顺序),并且在新的顺序上它将开始创建批次:批次1:1-10,批次2:11-20等
如果我设置shuffle = 'batch'
它应该如何在后台工作?直观地说,使用前面的 100 个样本数据集的示例,批量大小 = 10,我的猜测是 keras 首先将样本分配给批次(即批次 1:样本 1-10 遵循数据集原始顺序,批次 2:11-20 遵循数据集的原始顺序也是如此,批次 3 ... 依此类推),然后打乱批次的顺序。因此模型现在将在随机排序的批次上进行训练,例如:3(包含样本 21 - 30)、4(包含样本 31 - 40)、7(包含样本 61 - 70)、1(包含样本 1 - 10 ), ... (我制定了批次的顺序)。
我的想法是对的还是我错过了什么?
谢谢!