我可以使用 CMUSphinx4 将特定语音解码为音素并将这些音素用于进一步的实现吗?
问问题
1446 次
2 回答
3
如果您使用的是 sphinx4(beta 6),框架中有一个名为getBestPronunciationResult()的方法
"当应用程序希望音素在最佳最终路径上时使用该方法。请注意,单词可能有多个发音,因此这不等同于单词路径,例如 one[HH,W,AH,N] to[T ,UW] 三[TH,R,IY]
返回:最佳路径上的单词字符串和相关音素"
位置:src/sphinx4/edu/cmu/sphinx/result/Result.java
Token.java 是执行实际工作的类。
希望这可以帮助。
于 2014-01-18T10:49:27.063 回答
1
找到了这个示例代码,它将接受识别结果对象并转储音素:http ://cmusphinx.sourceforge.net/wiki/sphinx4:unittimestamps
我发现这篇论文对理解 Sphinx4 非常有用:http ://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4Whitepaper.pdf
一旦我了解了架构,我就浏览了 javadoc 页面上的包列表。
希望有帮助。祝你好运 !
于 2013-07-30T22:16:53.013 回答