与线性回归和逻辑回归不同,人工神经网络的成本函数不是凸的,因此容易受到局部最优的影响。谁能提供一个直觉,说明为什么人工神经网络会出现这种情况以及为什么不能修改假设以产生凸函数?
问问题
3796 次
1 回答
1
我在这里找到了足够的解释:
https://stats.stackexchange.com/questions/106334/cost-function-of-neural-network-is-non-convex
基本上,由于权重在各层之间是可置换的,因此任何最小值都有多种解决方案可以达到相同的结果,因此该函数不能是凸的(或凹的)。
于 2017-08-17T23:09:02.340 回答