speech-recognition - 在 Sphinx4 中将语音解码为音素

Question

我可以使用 CMUSphinx4 将特定语音解码为音素并将这些音素用于进一步的实现吗？

score 3 · Accepted Answer

如果您使用的是 sphinx4（beta 6），框架中有一个名为getBestPronunciationResult()的方法

"当应用程序希望音素在最佳最终路径上时使用该方法。请注意，单词可能有多个发音，因此这不等同于单词路径，例如 one[HH,W,AH,N] to[T ,UW] 三[TH,R,IY]

返回：最佳路径上的单词字符串和相关音素"

位置：src/sphinx4/edu/cmu/sphinx/result/Result.java

Token.java 是执行实际工作的类。

希望这可以帮助。

score 1 · Accepted Answer

找到了这个示例代码，它将接受识别结果对象并转储音素：http ://cmusphinx.sourceforge.net/wiki/sphinx4:unittimestamps

一旦我了解了架构，我就浏览了 javadoc 页面上的包列表。

希望有帮助。祝你好运！

2 回答 2