在哪里可以找到有关 ARPA 语言模型格式的文档?
我正在开发带有袖珍狮身人面像 STT 引擎的简单语音识别应用程序。出于性能原因,建议使用 ARPA。我想了解我可以做多少调整我的语言模型以满足我的自定义需求。
我发现的只是一些非常简短的 ARPA 格式描述:
- http://kered.org/blog/2008-08-12/arpa-language-model-file-format/
- http://www.speech.sri.com/projects/srilm/manpages/ngram-format.5.html
- http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html
我是 STT 的初学者,我很难理解这个(n-gram 等)。我正在寻找更详细的文档。类似于 JSGF 语法的文档在这里: