我已经实现了以下批量梯度下降算法,基于我能够在网络和讲义中找到的各种资源。
这种实现在停止标准方面并不理想,但对于我的示例来说它应该可以工作。
输入:
x = [1,1;1,2;1,3;1,4;1,5];
y = [1;2;3;4;5];
theta = [0;0];
代码:
tempTheta = [0;0];
for c = 1:10000,
for j = 1:2,
sum = 0;
for i = 1:5,
sum = sum + ((dot(theta', x(i, :)) - y(j)) * x(i,j));
end
sum = (sum / 5) * 0.01;
tempTheta(j) = theta(j) - sum;
end
theta = tempTheta;
end
预期的结果是theta = [0;1]
,但我的实现总是返回 theta = [-3.5, 1.5]
。
我尝试了 alpha 和起点的各种组合,但没有运气。我在哪里犯错?