2

我想制作一个 iOS 应用程序,允许我绘制用户读入的音频样本的语调(他们声音的音高的上升和下降)。语调在世界各地的各种语言中都非常重要,这将是一种练习语调和发音的尝试。

我对语音/音频技术的世界不是很精通,那我需要什么?是否有随 Cocoa-touch 一起安装的库,让我能够从语音样本中访问我需要的数据?我到底要捕捉什么?

如果有人对我需要利用的技术有所了解,我将不胜感激。

谢谢!

4

1 回答 1

1

您正在寻找的是所谓的共振峰分析。

共振峰本质上是发出声音的频谱峰值。它们按频率顺序列出,如 f1、f2 等。在我看来,您要绘制的是 f1。

共振峰分析是语音识别的核心,通常 f1 和 f2 足以区分元音。我建议您搜索共振峰分析算法并从那里获取。

祝你好运 :)

于 2012-08-30T06:15:03.247 回答