关于在 Windows 7 中使用 CMU Sphinx:打包的二进制文件没有说明或示例。我正在尝试对 sphinx 进行评估,并想简单地将音频文件转换为文本以便快速尝试。没有示例,如何使用可执行文件?
问问题
2856 次
1 回答
3
Pocketsphinx 发行版具有以下二进制文件:
- pocketsphinx_batch - 用于在测试数据库上测试识别
- pocketsphinx_continuous - 用于识别来自麦克风的音频
要使用 pocketsphinx 连续识别麦克风输入,请使用顶部文件夹中的以下内容:
bin\Release\pocketsphinx_continuous.exe -hmm model\hmm\en_US\hub4wsj_sc_8k -lm model\lm\en_US\ehub4.5000.DMP -dict model\lm\en_US\cmu07a.dic
要从 16khz 16 位单声道格式的 WAV 文件中识别音频:
bin\Release\pocketsphinx_continuous.exe -hmm model\hmm\en_US\hub4wsj_sc_8k -lm model\lm\en_US\ehub4.5000.DMP -dict model\lm\en_US\cmu07a.dic -infile file.wav
您不应该假设使用此命令识别结果将是准确的。
CMUSphinx 是一个复杂的软件,目前不容易评估。您绝对不应该假设有一种快速简便的方法来正确测试它。很可能通过 5 分钟的测试,您会得出结论它不起作用。
您需要了解语音识别的基础知识才能应用 CMUSphinx。首先,至少阅读教程
http://cmusphinx.sourceforge.net/wiki/tutorial
正确的评估需要以下几点:
- 您需要收集描述您的数据的代表性集合
- 您需要找出默认通用设置对您的测试数据提供的准确度
- 您需要了解准确性问题并尝试解决它们
要获得有关 CMUSphinx 的帮助,值得在论坛上询问问题。您需要提供测试数据集以获得准确性/性能方面的帮助。
于 2013-09-19T22:19:26.867 回答