我目前正在尝试为 CLDNN(卷积、LSTM、深度神经网络)提出一种新颖的结构
就像任何其他网络一样,我很难优化超参数。
我想尝试网格搜索和随机搜索来获得一组最佳的超参数,但我不清楚一些事情。
如果我使用一组临时超参数运行网络模拟,我如何衡量超参数的“优度”?我正在考虑在每次模拟 N 轮后记录成本和训练精度。
由于每次模拟都需要相对较长的时间(对于我的网络来说,训练一个 epoch 大约需要 70 秒),有没有更快的方法来检查超参数的“好坏”,而无需实际运行完整的训练?
是否有关于超参数优化的一般提示/建议?