optimization - 神经网络，局部最小规避技术

Question

我是这个主题的新手，并尝试了一些不同的事情来逃避本地最低要求。我使用随机学习率和动量，但对于一小部分训练，它卡住并且无法学习任何东西（有时卡在开始，有时在中间），即使是随机的起始权重和偏差。

我尝试了几种不同的设置来教授 XOR，例如：

 1)Faster learning but with a bigger chance of locally trapped. 
 (learns in less than 1200 iterations total)

 2)Slow learning but with evading local minimum better.
 (learns under 40k iterations total)

 3)Very steep learning with ~%50 chance of pit-fall(learns under 300 iterations total)

问题：让几个学生参加培训并选择最好的学习者值得吗？或者我们是否需要专注于为单一设置获得 %100 的成功率？

例子：

 3 students (XOR candidates) learning in parallel: 

 -First student is learning fast(learns first, tells others to stop to save cycles)
 -Other two are slow learners to increase success rate of training

score 5 · Accepted Answer

有许多可能的方法来逃避局部最小值。过去曾研究过并行学习，结果不同，但没有达到“全局使用”。一些研究人员简单地提出使用不同参数和/或起点的重复训练，其他人尝试使用其他训练算法，如模拟退火报告良好的结果。

最新的方法包括所谓的极限学习机，其中神经网络以高度正则化的形式学习，使用 Moore-Penrose 伪逆找到全局最小值。如果您在工作中遇到局部最小值问题，我建议您尝试一下，作为一个非常新的、强大且取得令人惊讶的好结果的模型 - 模型。

我真的不明白你为什么要提到 XOR 问题，AFAIK这个问题没有局部最小值。

我从未听过有人称机器学习模型为“学生”，这使得这个问题读起来很奇怪。有些人用的是“学习者”但“学生”？

optimization - 神经网络，局部最小规避技术

1 回答 1

Related

Reference