0

我想知道,您通常运行多少个 epoch 来训练 mozilla 深度语音,并使用其默认架构。(与 GitHub 版本相比没有变化)。要运行的合适的 epoch 数量是多少,特别是考虑到可用基础架构上的每个 epoch 都需要相当多的时间?((Tesla K80 单 GPU))

另一方面,如果提前停止(默认标准),这个数字是多少?感谢您的建议/建议。

训练数据:简历

4

1 回答 1

1

一个好的经验法则是只要模型学习就让它运行,即只要验证误差低于训练误差。您可以在运行时监控它,因为它打印到控制台或使用例如参数 dropout_rate 自动执行此操作。如果将其设置为 0.1 之类的值,它将在验证错误非常接近训练错误时停止。

当然,这也取决于其他参数设置和您的数据。

  • n_hidden 和 epoch 是影响模型精度的主要参数
  • n_hidden 和 train_batch_size 影响速度(如果 n_hidden 较小而 train_batch_size 较大,速度会更快)。
于 2019-03-14T01:24:01.360 回答