我是语音处理的新手。所以请原谅我的无知。我收到了一个简短的语音信号(10 秒),并被要求使用 MATLAB 或 Wavesufer 软件手动注释音高。现在如何找到语音信号的音高?是否有任何理论资源可以帮助解决这个问题?我尝试使用 Wavesurfer 绘制信号的音高轮廓。对吗?
编辑 1:我的工作是为我们的数据应用各种音高检测算法并比较它们的准确性。所以手动注释的音高作为参考。
更新 1:我通过区分 EGG (dEGG) 信号获得了 GCI (Glottal Closure Instants),而 dEGG 中的峰值是 GCI。两个连续 GCI 之间的时间间隔是音调周期 (s)。音调周期的倒数是音调(hz)。
更新 2:SIGMA 是一种著名的自动 GCI 检测算法。
感谢大家。