0

作为概念的基本证明,在一个使用输入 x、偏差 b、输出 y、S 个样本、权重 v 和 t 教师信号对 K 类进行分类的网络中,如果匹配样本在 k 类之下,则 t(k) 等于 1。

变量

让 x_(is) 表示 s_(th) 样本中的 i_(th) 输入特征。v_(ks) 表示一个向量,该向量包含从 s_(th) 样本中的所有输入到 k_(th) 输出的连接权重。t_(s) 表示 s_(th) 样本的教师信号。

如果我们扩展上述变量以考虑多个样本,则必须在声明变量 z_(k)、激活函数 f(.) 并使用 corss 熵作为成本函数时应用以下更改: 推导

通常在学习规则中,总是包含 delta ( t_(k) - y_(k) ),为什么 Delta 没有出现在这个等式中?我是否遗漏了某些东西,或者显示的 delta 规则不是必须的?

4

1 回答 1

0

我设法找到了解决方案,当我们考虑 Kronecker delta 时很清楚,其中 Where(如果类与分类器匹配,则 δck = 1,否则为 δck)。这意味着推导采用这种形式:

推导

这导致了增量规则。

于 2016-06-13T04:35:11.800 回答