python - 在 CNN 分类的 10 倍交叉验证中，如何防止一个倍比其他 9 倍表现差很多

Question

我目前正在 Keras 中研究用于 MRI 分类的 2D CNN。班级比例约为 60/40，我有 155 名患者，每个患者都有一个 MRI，由大约 180 个切片组成，CNN 的输入是 MRI 图像的切片（256*256 px）（所以总共输入约为 27900图像，每个 256*256 像素）。

我测试了不同的模型，并总是使用混洗分层 10 折交叉验证和 EarlyStopping 监视器对它们进行评估，它们都表现得非常好，验证准确率约为 95% 到 98%。但是每次，一到两次的表现都比其他的差很多（70% 到 80% 的验证准确率）。由于褶皱是随机的，我希望褶皱的表现都一样好。

有人可以解释这是如何发生的以及如何防止它吗？

准确度和损失图：

训练准确度和验证准确度

训练损失和验证损失

这是其中一个模型的一部分：

num_classes = 2
img_size = 256
batch_size = 200

# Because of EarlyStopping monitor, the number of epochs doesn't really matter
num_epochs = 1000

kfold_splits = 10
skf = StratifiedKFold(n_splits=kfold_splits, shuffle=True)

# Here the data is split 
for index, (train_index, test_index) in enumerate(skf.split(x_data_paths, y_data_paths)):

    x_train, x_test = np.array(x_data_paths)[train_index.astype(int)], np.array(x_data_paths)[test_index.astype(int)]
    y_train, y_test = np.array(y_data_paths)[train_index.astype(int)], np.array(y_data_paths)[test_index.astype(int)]

    training_batch_generator = BcMRISequence(x_train, y_train_one_hot, batch_size)
    test_batch_generator = BcMRISequence(x_test, y_test_one_hot, batch_size)

    # region Create model (using the functional API)
    inputs = Input(shape=(img_size, img_size, 1))
    conv1 = Conv2D(64, kernel_size=5, strides=1, activation='relu')(inputs)
    pool1 = MaxPooling2D(pool_size=3, strides=(2, 2), padding='valid')(conv1)
    conv2 = Conv2D(32, kernel_size=3, activation='relu')(pool1)
    pool2 = MaxPooling2D(pool_size=(2, 2))(conv2)
    conv3 = Conv2D(16, kernel_size=3, activation='relu')(pool2)
    pool3 = MaxPooling2D(pool_size=(2, 2))(conv3)
    flat = Flatten()(pool3)
    hidden1 = Dense(10, activation='relu')(flat)
    output = Dense(num_classes, activation='softmax')(hidden1)
    model = Model(inputs=inputs, outputs=output)

score 0 · Accepted Answer

以防万一其他人偶然发现我的问题：通过使用 10 次迭代而不是 10 折交叉验证的分层随机拆分，我摆脱了异常值折叠。我的猜测是由于某种“批量效应”（10 折交叉验证不会打乱 MRI 切片，只有患者），才会出现这种糟糕的折叠。另一方面，shuffle 拆分确实在拆分为训练和测试之前对整个数据集进行了洗牌，因此避免了“坏”患者一起出现在一个折叠中。

这些是新的情节，以防有人感兴趣。与以前相同的模型，只是随机拆分而不是 k 折交叉验证。

训练准确度和验证准确度

训练损失和验证损失

python - 在 CNN 分类的 10 倍交叉验证中，如何防止一个倍比其他 9 倍表现差很多

1 回答 1

Related

Reference