0

在 TensorFlow 中调度超参数的方法是什么?

也就是说,为了可重复性,我想使用建议的学习率计划 {0: 0.1, 1: 1., 100: 0.01, 150: 0.001} 来实现 ResNet(你说出一个),或者仅在之后启用权重衰减最初的几个初始时期。

例如,tensorpack 提供如下选项:

ScheduledHyperParamSetter('learning_rate', [(1, 0.1), (82, 0.01), (123, 0.001), (300, 0.0002)])

如何在原生 TF 中做到这一点?

4

1 回答 1

0

好吧,没那么难

    schedule = {1: 0.1, 2: 0.2, 3: 0.3, 4: 0.4, 100: 0.01, 150: 0.001}
    schedule = sorted(config.lr_schedule.items(), key=lambda x: x[0])

    boundaries = [num_train_iter * int(x[0]) for x in schedule]
    rates = [x[1] for x in schedule]
    rates = rates[:1] + rates  # 
    assert len(boundaries) + 1 == len(rates)

    learning_rate = tf.train.piecewise_constant(tf.cast(global_step, tf.int32), boundaries, rates)
于 2017-12-20T00:53:16.750 回答