我正在努力让 textsum 实现工作,最近得到了我自己的抓取数据。我昨晚开始针对 38000 篇文章进行培训。今天早上当我查看平均损失时,我在 5.2000000 左右。例如,当我玩 textsum 玩具套装时,我能够快速降低到 0.0000054 左右,但这仅针对 20 篇文章。
我希望有更多经验的人能给我一些关于培训需要多长时间的期望。我目前在 Nvidia 980M 上运行它。上周我确实想试用 AWS g2.2xlarge 实例,但具有讽刺意味的是,我的本地机器处理事情的速度似乎比 Grid 520 快。我仍然想测试 P2 实例和谷歌云,但现在我想我只打算使用我的本地机器。
关于我应该期待什么,任何人都可以在这里提供任何信息?谢谢!