我正在使用 keras Tuner 对 ANN 模型进行超参数调整。我将模型中的层数更改为 2 到 5 之间,节点介于 10 到 30 之间。我正在使用 keras 调谐器的随机搜索模型来选择性能最佳的模型。当我观察结果时,排名靠前的结果如下:
Best val_mse So Far: 0.03936238835255305
Total elapsed time: 01h 23m 53s
Results summary
Results in project\Sd attempt10
Showing 10 best trials
Objective(name='val_mse', direction='min')
Trial summary
Hyperparameters:
num_layers: 3
units_0: 15
units_1: 15
learning_rate: 0.001
units_2: 10
Score: 0.03936238835255305
Trial summary
Hyperparameters:
num_layers: 3
units_0: 15
units_1: 25
learning_rate: 0.01
units_2: 20
units_3: 25
units_4: 10
Score: 0.03974008063475291
我们可以看到,在第二次试验总结中,虽然没有 3 层,但存在 5 个隐藏层的单元。
我还附上了到达结果的代码片段。
def build_model(hp):
model = keras.Sequential()
for i in range(hp.Int('num_layers', 2, 5)):
model.add(layers.Dense(units=hp.Int('units_' + str(i),
min_value=10,
max_value=30,
step=5),
activation='relu'))
model.add(layers.Dense(1, activation='linear'))
model.compile(
optimizer=keras.optimizers.Adam(
hp.Choice('learning_rate', [1e-2, 1e-3, 1e-4])),
loss='mse',#'mean_absolute_error',
metrics=['mse','mae'])#['mean_absolute_error'])
return model
tuner = RandomSearch(
build_model,
objective='val_mse',
max_trials=25,
executions_per_trial=3,
directory='project',
project_name='Sd attempt10')
tuner.search(X_train, y_train,
epochs=100,
validation_data=(Xnew, yact))
print(tuner.results_summary())
有人可以用结果来解释这种行为。