尝试edu.cmu.sphinx.pocketsphinx和 processRaw 来检测语音。
使用以下配置:
en-us.lm.bin 语言模型
en-us-ptm 声学模型
cmudict-en-us.dict 字典
还将 remove_noise 设置为 True 并将 samprate 设置为 8000
我想做一个 Ngram 搜索。
这是我使用的循环:
Decoder decoder = recognizer.getDecoder();
int chunk_size = 1024;
int index_start = 0;
int index_finish = index_start+chunk_size-1;
boolean doit = true;
decoder.startUtt();
while (doit)
{
short[] slice = Arrays.copyOfRange(audioBuffer, index_start, index_finish);
int processRawRes = decoder.processRaw((slice), slice.length, false, false);
index_start = index_finish;
index_finish = index_start+chunk_size-1;
if (index_finish>audioBuffer.length-1)
{
doit = false;
}
}// while (doit)
decoder.endUtt();
我什么时候打电话
decoder.getInSpeech();
谢谢。