0

我想创建一个模型来识别阿拉伯字母。我知道如何创建语言模型和字典文件,但我被困在声学模型上。我为每个字母记录了wav文件,但是在培训期间,它说培训时间太少了,尽管培训仍在继续。当我尝试使用它时,模型无法识别任何东西(给 null)。

我想知道我应该如何记录 wav 文件,我应该继续重复,例如,在一个 wav 文件中重复 100 次Alif之类的字母,还是应该只记录同一个字母的多个 wav 文件。

非常感谢您的帮助。

4

1 回答 1

1

我想知道我应该如何记录 wav 文件,我应该继续重复,例如,在一个 wav 文件中重复 100 次 Alif 之类的字母,还是应该只记录同一个字母的多个 wav 文件。

最好有多个带有连续单词的文件,而不是字母。字母很难识别。

当我尝试使用它时,模型无法识别任何东西(给 null)。

这里可能存在不同的问题(错误的音频格式等)。您可以使用 Dropbox 在 CMUSphinx 论坛上共享您的数据库,以获得有关此问题的帮助。

于 2014-10-06T09:48:32.153 回答