python - 已经训练好的用于单词识别的 HMM 模型

Question

我已经使用自动编码器实现了一个音素分类器（给定一个音频文件数组，它返回所有识别的音素）。我想扩展这个项目，以便可以识别单词。是否存在已经训练过的 HMM 模型（英文）可以识别给定音素列表的单词？

谢谢大家。

score 0 · Accepted Answer

我不知道有任何解码器可以帮助你。语音识别软件不能以这种方式工作。

通常这样的事情需要自定义实现动态波束搜索。这不是一项艰巨的任务，可能只有 100 行代码。它还取决于您的语音解码器产生的内容。它是语音格子（理想情况下），还是有分数的 1-best 结果，或者只是没有分数的 1-best 结果。

如果您有适当的格子，您可能想尝试使用 openfst 工具包，将 LM 和字典转换为 FST，然后使用格子 FST 组合，然后使用 fstbestpath 找到最佳路径。不过，您可以简单地编写动态搜索，而不是所有这些语音转换。

百度在他们的项目中也将语音转换为字母，然后使用语言模型来修复字母序列。但他们说，没有语言模型，它同样工作得很好。

1 回答 1