我是一名编程爱好者,所以请原谅我并帮助填补任何空白。据我了解,神经网络的良好结果需要 sigmoid 和学习率或步率(取决于训练方法)与学习迭代一起正确设置.
虽然有很多关于这些价值观和泛化原则以及避免过度拟合的教育,但似乎并没有太多关注它们与数据和网络的关系。
我注意到样本、神经元和输入的数量似乎与这些设置最适合的地方成比例。(例如,更多或更少的输入可能会改变迭代 req)。
有没有一种数学方法可以根据已知值(例如样本、输入、输出、层等)为 sigmoid、学习率、步骤、迭代等找到一个好的(近似)起点?