我想从歌声中提取音高。有问题的曲目仅包含一个声音,没有其他声音。
我想知道给定时间点的响度和感知的音高频率。所以类似于以下内容:
0.0sec 400Hz -20dB 0.1 秒 401Hz -9dB 0.2秒 403Hz -10dB 0.3秒 403Hz -10dB 0.4 秒 404Hz -11dB 0.5秒 406Hz -13dB 0.6 秒 410Hz -15dB 0.7 秒 411Hz -16dB 0.8 秒 409Hz -20dB 0.9 秒 407Hz -24dB 1.0秒 402Hz -34dB
我怎样才能实现这样的输出?我对相对于特定音符值的频率轻微变化感兴趣。我有一些 DSP 知识,可以用 C++ 和 python 编程,但如果可能的话,我想避免重新发明轮子。