我想使用 CMU 袖珍狮身人面像来识别一小组单词。我为他们创建了一个语料库并在这里创建了模型文件 - http://www.speech.cs.cmu.edu/tools/lmtool.html。
现在,当我在我的 12 核 Linux 机器上使用此模型运行 pocketsphinx_continuous 可执行文件时,识别每个单词大约需要 5 秒。
- 这个库通常这么慢还是我做错了什么?
- 控制台输出显示它仍在搜索和评估大量单词,因为我的模型大小只有 12 个单词。
- 是否有任何其他轻量级且易于使用的库可以用于这个简单的任务,即在大约 12-15 个单词之间进行区分。