尽管我设置了种子,但我目前有可重复性问题。我知道模型的初始化方式相同(通过检查model.save("initial.h5")
withh5dump
和 meld 进行检查)。
接下来我要检查训练样本是否以相同的顺序使用。因此,我想记录它们。
我通过训练
model.fit(dataset['train']['X'],
dataset['train']['y'],
epochs=cfg['model']['nb_epochs'],
batch_size=cfg['model']['batch_size'],
validation_split=cfg['model']['validation_split'],
callbacks=[checkpoint], class_weight=cw)
我也可以加dataset['train']['id']
。我想获得一个包含正在使用的 ID 列表的 txt 文件,例如,对于 32 的批量大小、765 的训练数据集长度和 5 个 epoch,我希望 txt 文件中有 765 * 5 = 3825 行,其中每个ID 大概出现了 5 次,前 32 个元素是第一批的 ID。
那可能吗?