我想从音频文件(WAV)中提取语音信号的响度。我相信这是一个感知量,不仅取决于信号的幅度,还取决于所涉及的频率。我找到了一个有用的链接https://github.com/librosa/librosa/issues/463但我
- 想使用有效计算的现有包
- 我不确定这里描述的方法是否合适。
对于 1,我发现Parselmouth是Praat的一个包装器,可以使用,但我不确定在提取强度和音高值后如何进行:
snd = parselmouth.Sound(path)
intensity = snd.to_intensity()
pitch = snd.to_pitch()
我也研究了Pydub和PyAudioAnalysis但也找不到使用它们来评估响度的直接方法。
什么是从 WAV 文件中提取响度的 Pythonic、面向对象的封装方式?