我目前正在为我的语言实施 DeepSpeech。我有 2 个目录:训练和测试。Train 大约有 15000 个 wav,测试大约 3000 个。我面临的问题是在训练期间我有很大的损失,而对于测试部分的损失是巨大的。
你能给我一些关于我应该做什么的提示吗?谢谢!
新的DeepSpeech PlayBook包含有关训练和测试的部分,可以在此处提供一些指导。
立即突出的一件事是您没有验证集。这将是我要更改的第一件事 - 确保您有一个验证集。有关测试、验证和训练集之间差异的更多信息,请参阅本文。
您正在使用一个alphabet.txt
很棒的自定义文件 - 我假设它包含罗马尼亚字母表的所有字符?
接下来的事情是降低高原学习率- 这在 PlayBook 中有介绍。
马尔特诺洛克。