2

我是 Sphinx 4 的新手,正在尝试制作简单的数字识别应用程序。我有一组带有 3 位数字的 wav,发音为短暂停(如 one_five_nine.wav)用于测试。问题是文件识别在找到第一个数字后停止,所以我只有“一个”作为 one_five_nine.wav 的输出。

这是我的前端配置

<component name="epFrontEnd16k" type="edu.cmu.sphinx.frontend.FrontEnd">
    <propertylist name="pipeline">
        <item>audioFileDataSource</item>
        <item>dataBlocker </item>
        <item>speechClassifier </item>
        <item>speechMarker </item>
        <item>nonSpeechDataFilter </item>
        <item>preemphasizer </item>
        <item>windower </item>
        <item>fft </item>
        <item>melFilterBankFor16k</item>
        <item>dct </item>
        <item>liveCMN </item>
        <item>featureExtraction </item>
    </propertylist>
</component>

和代码

    Recognizer recognizer = (Recognizer) cm.lookup("recognizer");
    recognizer.allocate();

    AudioFileDataSource dataSource = (AudioFileDataSource) cm.lookup("audioFileDataSource");

    File folder = new File(testDataSetDirectory);
    for (final File fileEntry : folder.listFiles()) {
        // retrive URL
        URL audioURL = null;
        try {
            audioURL = fileEntry.toURL();
        } catch (MalformedURLException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

        // configure the audio input for the recognizer
        dataSource.setAudioFile(audioURL, null);

        Result result = recognizer.recognize();         
        String recognizedText = result != null ? result.getBestFinalResultNoFiller() : "null";

        // print
        System.out.println(fileEntry.getName() + ":\t" + recognizedText);
    }

谢谢你的帮助。

4

1 回答 1

0

您需要在循环中调用识别器:

 Result result;
 while(true) {
    result = recognizer.recognize();         
    if (result == null)
         break;
 }
于 2013-04-15T17:51:51.100 回答