因此,我正在对每个类别中包含 250 个图像的小型数据集进行二值图像分类,我使用Resnet50作为基础网络架构的迁移学习,并在其上添加了 2 个隐藏层和一个最终输出层,经过 20 次训练时代,我所看到的是损失在初始时代突然增加,我无法理解其背后的原因。
网络架构-
image_input = Input(shape=(224, 224, 3))
model = ResNet50(input_tensor=image_input,include_top=True, weights='imagenet')
last_layer = model.get_layer('avg_pool').output
x = Flatten(name='flatten')(last_layer)
x = Dense(1000, activation='relu', name='fc1000')(x)
x = Dropout(0.5)(x)
x = Dense(200, activation='relu', name='fc200')(x)
x = Dropout(0.5)(x)
out = Dense(num_classes, activation='softmax', name='output')(x)
custom_model = Model(image_input, out)
我正在使用带有默认参数的binary_crossentropy,Adam