根据wikipedia,使用 delta 规则,我们通过以下方式调整权重:
dw = alpha * (ti-yi)*g'(hj)xi
当 alpha = 学习常数时,ti - 真实答案,yi - 感知器的猜测,g' = 激活函数 g 相对于感知器输入的加权和的导数,xi - 输入。
在这个公式中我不明白的部分是乘以导数 g'。让 g = sign(x)(加权和的符号)。所以 g' 总是 0,并且 dw = 0。但是,在我在互联网上看到的代码示例中,作者只是省略了 g' 并使用了公式:
dw = alpha * (ti-yi)*(hj)xi
我会很高兴阅读正确的解释!
先感谢您。