我创建了一个启发式(ANN,但这并不重要)来估计事件的概率(体育比赛的结果,但这也不重要)。给定一些输入,这个启发式告诉我事件的概率是多少。类似于:鉴于这些输入,B 队有 65% 的机会获胜。
我有大量输入数据,现在我得到了结果(以前玩过的游戏)。我可以使用哪个公式/指标来限定我的估算器的准确性。
我看到的问题是,如果估计者说事件有 20% 的概率并且事件确实发生了。我无法判断我的估算器是对还是错。也许这是错误的,事件的可能性更大。也许它是正确的,事件发生的几率大约为 20%,并且确实发生了。也许是错的,事件发生的机会非常低,比如说千分之一,但这次恰好发生了。
幸运的是,我有很多这些实际测试数据,所以可能有一种方法可以使用它们来限定我的启发式方法。
有人有想法吗?