1

我可以使用 CMUSphinx4 将特定语音解码为音素并将这些音素用于进一步的实现吗?

4

2 回答 2

3

如果您使用的是 sphinx4(beta 6),框架中有一个名为getBestPronunciationResult()的方法

"当应用程序希望音素在最佳最终路径上时使用该方法。请注意,单词可能有多个发音,因此这不等同于单词路径,例如 one[HH,W,AH,N] to[T ,UW] 三[TH,R,IY]

返回:最佳路径上的单词字符串和相关音素"

位置:src/sphinx4/edu/cmu/sphinx/result/Result.java

Token.java 是执行实际工作的类。

希望这可以帮助。

于 2014-01-18T10:49:27.063 回答
1

找到了这个示例代码,它将接受识别结果对象并转储音素:http ://cmusphinx.sourceforge.net/wiki/sphinx4:unittimestamps

我发现这篇论文对理解 Sphinx4 非常有用:http ://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4Whitepaper.pdf

一旦我了解了架构,我就浏览了 javadoc 页面上的包列表。

希望有帮助。祝你好运 !

于 2013-07-30T22:16:53.013 回答