1

我怎样才能最好地让我的网络不仅学习期望值,而且了解围绕该值的预期变化,这是一种不确定性的度量。对于网络以前从未见过的任何状态,这将是非常高的,对于网络已经多次见过的任何状态,它应该接近对预期变化的某种估计。

想知道是否可以通过(可能部分)重叠的网络同时“学习”这两个方面。

4

0 回答 0