2

关于在 Windows 7 中使用 CMU Sphinx:打包的二进制文件没有说明或示例。我正在尝试对 sphinx 进行评估,并想简单地将音频文件转换为文本以便快速尝试。没有示例,如何使用可执行文件?

4

1 回答 1

3

Pocketsphinx 发行版具有以下二进制文件:

  • pocketsphinx_batch - 用于在测试数据库上测试识别
  • pocketsphinx_continuous - 用于识别来自麦克风的音频

要使用 pocketsphinx 连续识别麦克风输入,请使用顶部文件夹中的以下内容:

bin\Release\pocketsphinx_continuous.exe -hmm  model\hmm\en_US\hub4wsj_sc_8k -lm model\lm\en_US\ehub4.5000.DMP -dict model\lm\en_US\cmu07a.dic

要从 16khz 16 位单声道格式的 WAV 文件中识别音频:

bin\Release\pocketsphinx_continuous.exe -hmm  model\hmm\en_US\hub4wsj_sc_8k -lm model\lm\en_US\ehub4.5000.DMP -dict model\lm\en_US\cmu07a.dic -infile file.wav

您不应该假设使用此命令识别结果将是准确的。

CMUSphinx 是一个复杂的软件,目前不容易评估。您绝对不应该假设有一种快速简便的方法来正确测试它。很可能通过 5 分钟的测试,您会得出结论它不起作用。

您需要了解语音识别的基础知识才能应用 CMUSphinx。首先,至少阅读教程

http://cmusphinx.sourceforge.net/wiki/tutorial

正确的评估需要以下几点:

  • 您需要收集描述您的数据的代表性集合
  • 您需要找出默认通用设置对您的测试数据提供的准确度
  • 您需要了解准确性问题并尝试解决它们

要获得有关 CMUSphinx 的帮助,值得在论坛上询问问题。您需要提供测试数据集以获得准确性/性能方面的帮助。

于 2013-09-19T22:19:26.867 回答