3

我有图像分类问题,我想使用 Keras 预训练模型来完成这项任务。当我使用这样的模型时

model = tf.keras.Sequential([
    hub.KerasLayer("https://tfhub.dev/google/tf2-preview/mobilenet_v2/feature_vector/4",
                   output_shape=[1280],
                   trainable=False),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(num_classes, activation='softmax')
])
model.build([None, image_size[0], image_size[1], 3])

model.compile(
    optimizer=tf.keras.optimizers.Adam(),
    loss='categorical_crossentropy',
    metrics=['acc'])

我很容易在平衡数据集上获得约 90% 的准确率和非常低的损失。但是,如果像这样使用 keras.application:

`base_model = tf.keras.applications.mobilenet_v2.MobileNetV2(
    input_shape=input_img_size,
    include_top=False,
    weights='imagenet'
)

base_model.trainable = False  

model = tf.keras.layers.Dropout(0.5)(model)

model = tf.keras.layers.Dense(num_classes, activation='softmax')(model)

model = tf.keras.models.Model(inputs=base_model.input, outputs=model)

model.compile(
    optimizer=tf.keras.optimizers.Adam(),
    loss='categorical_crossentropy',
    metrics=['acc'])`

并在数据生成器中使用适当的tf.keras.application.mobilenet_v2.preprocess_input函数(并保持其他所有内容相同),它被困在大约 60% 的验证和 80% 的训练中。 这些方法有什么区别?为什么一个优于另一个?

数据生成器:

datagen = tf.keras.preprocessing.image.ImageDataGenerator(
        preprocessing_function = preprocessing_function,
        rotation_range=10,
        zoom_range=0.3,
        width_shift_range=0.2,
        height_shift_range=0.2,
        horizontal_flip=True,
        vertical_flip=True,
        shear_range=0.2,
    )

训练:

 history = model.fit_generator(
    train_generator,
    epochs=nb_epochs,
    verbose=1,
    steps_per_epoch=steps_per_epoch,
    validation_data=valid_generator,
    validation_steps=val_steps_per_epoch,
    callbacks=[
        checkpoint,
        learning_rate_reduction,
        csv_logger,
        tensorboard_callback,
    ],
)
4

1 回答 1

1

我相信您正在训练两种不同的“模型”。在您的 TensorFlow Hub 示例中,您使用了 mobilenet 的特征向量。据我了解,特征向量与模型不同。它是一定长度的一维张量。它可能是 mobilenet 模型输出之前的最后一层。这与 tf.keras 示例不同,您在其中调用完整的 mobilenet 模型。

于 2020-09-30T01:04:36.723 回答