python - PocketSphinx python 和设置声学模型？

Question

我正在阅读这个关于语音识别的指南，它提到我需要三个语音识别项目：声学模型、语言模型、语音词典。

我想开始玩这个python 演示，它使用 Gstreamer 从麦克风捕获并重新采样为 8kHz、16 位 PCM 音频。

我看到我可以指定语言模型和拼音词典，我使用的是[由cmu提供]：

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/

但我很困惑我应该在哪里指定声学模型？gstreamer 是否有我隐含使用的自己的声学模型？我希望使用此处提供的声学模型获得更好的结果：

 http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Acoustic%20Model/

（对不起超链接。我不能发布超过 2 个代表小于 10 的链接）

score 3 · Accepted Answer

但我很困惑我应该在哪里指定声学模型？

您可以使用 gstreamer 元素的 hmm 属性指定模型。就像教程中介绍的一样

asr.set_property('lm', '/home/user/mylanguagemodel.lm')

您可以使用

asr.set_property('hmm', '/home/user/acoustic_model_folder')

gstreamer 是否有我隐含使用的自己的声学模型？

是的，默认情况下它使用发行版中的美国英语模型 hub4wsj_sc_8k

1 回答 1