2

我目前正在使用 tensorflow 和 mnist 代码。Yann Lecun 的 mnist 数据集包含 20x20 像素图像,这些图像通过计算像素的质心以 28x28 图像为中心。结果是至少有一个 4 像素的边框,可以改善结果分析。我在 mnist 上搜索并阅读了很多内容,但找不到使用 4 个像素的原因。我正在计算带有 5 像素边框的 100x100 像素图像,但我不知道这是否足够。我可以尝试更改边框大小并比较结果,但这需要我很长时间。我认为知识和应用良好实践会更好。那么如何定义最佳边框尺寸呢?

4

1 回答 1

3

根据我的经验,在 MNIST 之外使用边界根本不是常见的做法。如果您尝试识别图像中的对象(而不是数字),您应该只提供整个图像,可能带有一些随机裁剪或其他失真以帮助学习过程。其他任务的最佳实践会因领域而异,但通常来自对模型在生产中可能遇到的输入的相当常识的直觉。

于 2016-06-14T02:19:11.303 回答