python - 在 Keras Tuner 搜索期间，如何获得有状态 LSTM 来重置其状态？

Question

我正在尝试使用 Keras Tuner 调整有状态 LSTM。我的代码工作正常，它能够训练模型，但我仍然不知道如何让模型在时期之间重置状态。通常我会在一个循环中一次训练 1 个 epoch 并在 epoch 之间手动 reset_states。但是，我认为这对 Keras Tuner 来说是不可能的。有没有我可以使用的论点来实现这一点？这是我当前的调谐器代码如下：

def build_model(hp):
    model = Sequential()
    model.add(layers.Input(batch_shape=(batch_size,train_X.shape[1], train_X.shape[2])))
    for i in range(hp.Int('num_LSTM_layers', 1, 3)):
        model.add(layers.LSTM(units=hp.Int('units_' + str(i),min_value=32,max_value=512,step=4),
                    batch_input_shape=(batch_size,train_X.shape[1], train_X.shape[2]),
                         activation=hp.Choice('LSTM_activation_' + str(i),values=['relu','softplus',
                                                                 'tanh', 'sigmoid','softsign','selu','elu','linear'],
                    default='elu'),return_sequences=True,stateful=True))
    for j in range(hp.Int('num_dense_layers', 1, 3)):
        model.add(layers.Dense(units=hp.Int('units_' + str(i),min_value=64,max_value=1024,step=4),
                         activation=hp.Choice('dense_activation_' + str(i),values=['relu','softplus',
                                                                 'tanh', 'sigmoid','softsign','selu','elu','linear'],
                    default='elu')))
        model.add(layers.Dropout(rate=hp.Float('rate_' + str(i), min_value=0.01, max_value=0.50, step=0.01)))
    model.add(layers.Dense(train_y.shape[1],activation='linear'))
    model.compile(
            optimizer=hp.Choice('optimizers',values=['rmsprop','adam','adadelta','Nadam']),
            loss='mse',metrics=['mse'])
    return model

tuner_bo = BayesianOptimization(
            build_model,
            objective='val_loss',
            max_trials=50,
            executions_per_trial=3,overwrite=True,num_initial_points=10,
            directory=model_path,project_name='LSTM_KT_2001',
            allow_new_entries=True,tune_new_entries=True)

tuner_bo.search_space_summary()

tuner_bo.search(train_X, train_y, epochs=100,batch_size=1,validation_data=(test_X,test_y), verbose=2)

score 1 · Accepted Answer

我覆盖了调谐器类中的 on_epoch_end 方法，不确定该方法是否正确。

class MyBayesianOptimization(BayesianOptimization):
    def on_epoch_end(self, trial, my_hyper_model, epoch, logs=None):
        my_hyper_model.reset_states()
        super(MyBayesianOptimization, self).on_epoch_end(trial, my_hyper_model, epoch, logs)

python - 在 Keras Tuner 搜索期间，如何获得有状态 LSTM 来重置其状态？

1 回答 1

Related

Reference