我是 Sphinx 4 的新手,正在尝试制作简单的数字识别应用程序。我有一组带有 3 位数字的 wav,发音为短暂停(如 one_five_nine.wav)用于测试。问题是文件识别在找到第一个数字后停止,所以我只有“一个”作为 one_five_nine.wav 的输出。
这是我的前端配置
<component name="epFrontEnd16k" type="edu.cmu.sphinx.frontend.FrontEnd">
<propertylist name="pipeline">
<item>audioFileDataSource</item>
<item>dataBlocker </item>
<item>speechClassifier </item>
<item>speechMarker </item>
<item>nonSpeechDataFilter </item>
<item>preemphasizer </item>
<item>windower </item>
<item>fft </item>
<item>melFilterBankFor16k</item>
<item>dct </item>
<item>liveCMN </item>
<item>featureExtraction </item>
</propertylist>
</component>
和代码
Recognizer recognizer = (Recognizer) cm.lookup("recognizer");
recognizer.allocate();
AudioFileDataSource dataSource = (AudioFileDataSource) cm.lookup("audioFileDataSource");
File folder = new File(testDataSetDirectory);
for (final File fileEntry : folder.listFiles()) {
// retrive URL
URL audioURL = null;
try {
audioURL = fileEntry.toURL();
} catch (MalformedURLException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
// configure the audio input for the recognizer
dataSource.setAudioFile(audioURL, null);
Result result = recognizer.recognize();
String recognizedText = result != null ? result.getBestFinalResultNoFiller() : "null";
// print
System.out.println(fileEntry.getName() + ":\t" + recognizedText);
}
谢谢你的帮助。