我正在使用automated focal loss
最近从https://arxiv.org/pdf/1904.09048.pdf实施的更快 rcnn 类型的系统
在上面链接的论文中,3.4. Regression
它指出
我们假设标签通过方差为 σ^2 的高斯分布围绕实际正确的基本事实分布。
和
然而,为了正确计算累积分布函数,需要估计任务的方差 σ^2。[...] 像网络的权重一样训练变量 σ^2。
我没有任务方差的数据σ^2
。
我不完全理解如何在没有数据的情况下学习它。
我应该简单地制作变量trainable
并假设优化知道该怎么做吗?