我正在使用卷积神经网络(无监督特征学习来检测特征 + Softmax 回归分类器)进行图像分类。我已经阅读了 Andrew NG 在这方面的所有教程。(http://ufldl.stanford.edu/wiki/index.php/UFLDL_Tutorial)。
我开发的网络有一个:
- 输入层 - 大小 8x8(64 个神经元)
- 隐藏层 - 大小 400 个神经元
- 输出层 - 大小 3
我已经学习了使用稀疏自动编码器将输入层连接到隐藏层的权重,因此具有 400 个不同的特征。
通过从任何输入图像 (64x64) 中获取连续的 8x8 补丁并将其馈送到输入层,我得到了 400 个大小为 (57x57) 的特征图。
然后我使用大小为 19 x 19 的窗口的最大池化来获得 400 个大小为 3x3 的特征图。
我将此特征图提供给 softmax 层,以将其分为 3 个不同的类别。
这些参数,例如隐藏层的数量(网络的深度)和每层的神经元数量,在教程中被提出,因为它们已成功用于一个特定的数据集,其中所有图像的大小为 64x64。
我想将此扩展到我自己的数据集,其中图像要大得多(比如 400x400)。我如何决定
层数。
每层的神经元数量。
池化窗口的大小(最大池化)。