cmusphinx - 声学模型小时数

Question

我想创建一个模型来识别阿拉伯字母。我知道如何创建语言模型和字典文件，但我被困在声学模型上。我为每个字母记录了wav文件，但是在培训期间，它说培训时间太少了，尽管培训仍在继续。当我尝试使用它时，模型无法识别任何东西（给 null）。

我想知道我应该如何记录 wav 文件，我应该继续重复，例如，在一个 wav 文件中重复 100 次Alif之类的字母，还是应该只记录同一个字母的多个 wav 文件。

非常感谢您的帮助。

score 1 · Accepted Answer

我想知道我应该如何记录 wav 文件，我应该继续重复，例如，在一个 wav 文件中重复 100 次 Alif 之类的字母，还是应该只记录同一个字母的多个 wav 文件。

最好有多个带有连续单词的文件，而不是字母。字母很难识别。

当我尝试使用它时，模型无法识别任何东西（给 null）。

这里可能存在不同的问题（错误的音频格式等）。您可以使用 Dropbox 在 CMUSphinx 论坛上共享您的数据库，以获得有关此问题的帮助。

1 回答 1