speech-recognition - 扩展 Sphinx 以支持本地语言

Question

最初我正在考虑从头开始编写一个语音识别引擎（支持 50-100 个单词）来支持我的母语。

然而，经过一些研究，很明显，即使在 1.5 年内支持非常有限，也无法制造出语音识别引擎。

现在我正在考虑扩展 sphinx 引擎以支持我的语言。是否有可能在 1.5 年内完成，甚至这对于最后一年的项目来说工作量太大了。

我正在焦急地等待你在这件事上的经验。

score 2 · Accepted Answer

是的，这当然是可能的。我为我的毕业论文做了一个类似的 Chatino 识别器。（Chatino 是墨西哥南部瓦哈卡的土著语言）。识别器包括一个孤立的单词识别器和一个使用 Sphinx4 构建的连续语音识别器。

score 2 · Accepted Answer

进行语音识别的时间取决于您的应用程序。

你会需要：

第10项是最耗时的任务！！！

答：是的，商业应用可以在 3 个月内完成。

Sphinx 是一种可能性，HTK 是一个优秀的开源语音识别系统，用于训练和测试一个完整的系统。Julius 是一个开源语音识别器（引擎），它使用由 HTK 构建的声学和语言模型。

路易斯·乌贝尔

ASR 实验室 - www.asrlabs.com.br

2 回答 2