像大多数数值超参数一样,学习率应该在对数域中进行探索,将其精炼超过 2 倍并没有太多收获,而探索的动态范围可能在 10^6 左右,学习费率通常低于 1。
在本段中,我想知道 1:log-domain 是什么意思?2:因子2有什么用?3:动态范围是什么意思?
谢谢!
像大多数数值超参数一样,学习率应该在对数域中进行探索,将其精炼超过 2 倍并没有太多收获,而探索的动态范围可能在 10^6 左右,学习费率通常低于 1。
在本段中,我想知道 1:log-domain 是什么意思?2:因子2有什么用?3:动态范围是什么意思?
谢谢!
它可能在谈论如何扩展学习率
1:http ://en.wikipedia.org/wiki/Logarithmic_scale