作为概念的基本证明,在一个使用输入 x、偏差 b、输出 y、S 个样本、权重 v 和 t 教师信号对 K 类进行分类的网络中,如果匹配样本在 k 类之下,则 t(k) 等于 1。
让 x_(is) 表示 s_(th) 样本中的 i_(th) 输入特征。v_(ks) 表示一个向量,该向量包含从 s_(th) 样本中的所有输入到 k_(th) 输出的连接权重。t_(s) 表示 s_(th) 样本的教师信号。
如果我们扩展上述变量以考虑多个样本,则必须在声明变量 z_(k)、激活函数 f(.) 并使用 corss 熵作为成本函数时应用以下更改: 推导
通常在学习规则中,总是包含 delta ( t_(k) - y_(k) ),为什么 Delta 没有出现在这个等式中?我是否遗漏了某些东西,或者显示的 delta 规则不是必须的?