python - 如何使用 Python 提取音频（WAV）文件中语音信号的感知响度？

Question

我想从音频文件（WAV）中提取语音信号的响度。我相信这是一个感知量，不仅取决于信号的幅度，还取决于所涉及的频率。我找到了一个有用的链接https://github.com/librosa/librosa/issues/463但我

想使用有效计算的现有包
我不确定这里描述的方法是否合适。

对于 1，我发现Parselmouth是 Praat的一个包装器，可以使用，但我不确定在提取强度和音高值后如何进行：

snd = parselmouth.Sound(path)

intensity = snd.to_intensity()
pitch = snd.to_pitch()

我也研究了Pydub和PyAudioAnalysis但也找不到使用它们来评估响度的直接方法。

什么是从 WAV 文件中提取响度的 Pythonic、面向对象的封装方式？

score 2 · Accepted Answer

您可以使用pyloudnorm：

import soundfile as sf
import pyloudnorm as pyln

data, rate = sf.read("test.wav")
meter = pyln.Meter(rate) #
loudness = meter.integrated_loudness(data)

python - 如何使用 Python 提取音频（WAV）文件中语音信号的感知响度？

1 回答 1

Related

Reference