0

我已经实现了以下批量梯度下降算法,基于我能够在网络和讲义中找到的各种资源。

这种实现在停止标准方面并不理想,但对于我的示例来说它应该可以工作。

输入:

x = [1,1;1,2;1,3;1,4;1,5];
y = [1;2;3;4;5];
theta = [0;0];

代码:

tempTheta = [0;0];

for c = 1:10000,
    for j = 1:2,
        sum = 0;
        for i = 1:5,
            sum = sum + ((dot(theta', x(i, :)) - y(j)) * x(i,j)); 
        end
        sum = (sum / 5) * 0.01;

        tempTheta(j) = theta(j) - sum;
    end
    theta = tempTheta;
end

预期的结果是theta = [0;1],但我的实现总是返回 theta = [-3.5, 1.5]

我尝试了 alpha 和起点的各种组合,但没有运气。我在哪里犯错?

4

1 回答 1

2

在这一行

sum = sum + ((dot(theta', x(i, :)) - y(j)) * x(i,j));

您使用了 的错误索引y,它应该是y(i),因为j是维度迭代器,而不是样本迭代器。

改变后

theta =

  -1.5168e-07
   1.0000e+00
于 2013-08-22T10:26:00.333 回答