speech-recognition - HTK 中的读取评估器

Question

我正在尝试开发一个阅读评估器（阅读导师的子集 - http://www.cs.cmu.edu/~listen/，它基于 CMUSphnix 语音识别器）。我的评估器将主要用于测试英语的韵律（或现在的流利程度），但用于测试尚不可用的印度口音。

具体来说，我会向读者展示一个阅读测试，其中包含一个固定的故事，比如 500-1000 个单词。语音数据将被记录并分析停顿、中断、音高、强度等，最后将根据评估为读者分配一个分数。

现在。这就是问题所在。对于较新的语言，HTK 需要事先指定 (1) 语法、(2) 发音模型和 (3) 声学模型（训练）。而在我的情况下，由于故事是固定的并且与庞大的英语词汇相比非常小，我认为可能不需要做所有这些。

我是这个领域的初学者，所以有人可以指导我什么是（a）最简单、最省力的方法来自己进行初步测试以进行快速演示（骨架）？(b) 在上面提到的三个模型中，应该改变什么以及如何为 2-3 个固定故事开发可靠的可测试原型？(c) 任何其他帮助我开始这个项目或任何其他建议/批评将不胜感激。

PS 同样，请注意，我们只会使用英语，但会在印度场景中进行测试；我们的总单词集会低到大约 100-200 个，所以我觉得识别准确率可以比通常的工具更好，而且工作量要低得多（训练、语法模型等）。

非常感谢。

0 回答 0