python - 调整 MobileNet 训练数据的百分比

Question

我想训练一个 MobileNet 来识别自定义图像类。但我不知道，如何告诉 MobileNet 提供的数据中有多少应该用作训练数据。

当您使用重新训练脚本时：

我可以设置验证和测试百分比。最大的问题是，这些百分比是如何计算的？

程序是否使用 100% 并将其分为 75% 的训练、10% 的验证和 15% 的测试？还是 MobileNet 提前分成 70% 的训练数据和 30% 的测试数据，然后将 70% 的 10% 作为验证数据？

我不明白这在 MobileNet 中是如何工作的？例如，我可以将训练数据的百分比调整为 85% 吗？

谢谢

score 1 · Accepted Answer

根据Tensorflow 在 MobileNet 上的文档，--testing_percentage和--validation_percentage参数控制以下内容：

通常的拆分是将 80% 的图像放入主训练集，保留 10% 以在训练期间经常运行作为验证，然后将最后的 10% 作为测试集较少使用以预测真实-分类器的世界性能。这些比率可以使用--testing_percentage和--validation_percentage标志来控制。

因此，我相信使用您当前的参数（--testing_percentage=15，--validation_percentage=10），您将有 75% 的数据用于主训练集中，15% 用于测试，10% 用于验证，正如您所建议的.

如果您想将训练数据的百分比从 75% 提高到 85%，可以通过设置：

--testing_percentage=10 和 --validation_percentage=5

或者

--testing_percentage=5 和 --validation_percentage=10

或任何其他组合，留下 85% 的数据用于训练。

即：训练% = 100% - 测试% - 验证%

但是，您需要注意不要将测试/验证百分比设置得太低，否则您的准确度分数可能没有足够的测试数据来验证您的预测准确度分数本身是否准确。

希望这可以帮助。

1 回答 1