我想创建一个模型来识别阿拉伯字母。我知道如何创建语言模型和字典文件,但我被困在声学模型上。我为每个字母记录了wav文件,但是在培训期间,它说培训时间太少了,尽管培训仍在继续。当我尝试使用它时,模型无法识别任何东西(给 null)。
我想知道我应该如何记录 wav 文件,我应该继续重复,例如,在一个 wav 文件中重复 100 次Alif之类的字母,还是应该只记录同一个字母的多个 wav 文件。
非常感谢您的帮助。
我想创建一个模型来识别阿拉伯字母。我知道如何创建语言模型和字典文件,但我被困在声学模型上。我为每个字母记录了wav文件,但是在培训期间,它说培训时间太少了,尽管培训仍在继续。当我尝试使用它时,模型无法识别任何东西(给 null)。
我想知道我应该如何记录 wav 文件,我应该继续重复,例如,在一个 wav 文件中重复 100 次Alif之类的字母,还是应该只记录同一个字母的多个 wav 文件。
非常感谢您的帮助。