我正在尝试构建一个基于 CMU Sphinx 的语音识别应用程序。我使用 lmtool 创建了自己的语言模型。但是为了提高识别的准确率,我想对Sphinx进行调优。但是对于选择absoluteBeamWidth、relativeBeamWidth、absoulteWordBeamWidth、languageWeight等属性是否有任何指导方针。我不确定这些属性是什么意思。此外,任何可以帮助我调整 Sphinx 的资源链接(不包括 sphinx 网站上不完整的调整链接)都将不胜感激。
谢谢
我正在尝试构建一个基于 CMU Sphinx 的语音识别应用程序。我使用 lmtool 创建了自己的语言模型。但是为了提高识别的准确率,我想对Sphinx进行调优。但是对于选择absoluteBeamWidth、relativeBeamWidth、absoulteWordBeamWidth、languageWeight等属性是否有任何指导方针。我不确定这些属性是什么意思。此外,任何可以帮助我调整 Sphinx 的资源链接(不包括 sphinx 网站上不完整的调整链接)都将不胜感激。
谢谢
但是为了提高识别的准确率,我想对Sphinx进行调优。
准确性不是通过调整来提高的,而是通过使用更好的模型和更高级的算法来提高的。有关详细信息,请参阅常见问题解答:
http://cmusphinx.sourceforge.net/wiki/faq#qwhy_my_accuracy_is_poor