1

我正在尝试开发一个阅读评估器(阅读导师的子集 - http://www.cs.cmu.edu/~listen/,它基于 CMUSphnix 语音识别器)。我的评估器将主要用于测试英语的韵律(或现在的流利程度),但用于测试尚不可用的印度口音。

具体来说,我会向读者展示一个阅读测试,其中包含一个固定的故事,比如 500-1000 个单词。语音数据将被记录并分析停顿、中断、音高、强度等,最后将根据评估为读者分配一个分数。

现在。这就是问题所在。对于较新的语言,HTK 需要事先指定 (1) 语法、(2) 发音模型和 (3) 声学模型(训练)。而在我的情况下,由于故事是固定的并且与庞大的英语词汇相比非常小,我认为可能不需要做所有这些。

我是这个领域的初学者,所以有人可以指导我什么是(a)最简单、最省力的方法来自己进行初步测试以进行快速演示(骨架)?(b) 在上面提到的三个模型中,应该改变什么以及如何为 2-3 个固定故事开发可靠的可测试原型?(c) 任何其他帮助我开始这个项目或任何其他建议/批评将不胜感激。

PS 同样,请注意,我们只会使用英语,但会在印度场景中进行测试;我们的总单词集会低到大约 100-200 个,所以我觉得识别准确率可以比通常的工具更好,而且工作量要低得多(训练、语法模型等)。

非常感谢。

4

0 回答 0