0

根据我在网上看到的,女声基频的正常范围是165到255赫兹。我正在使用 Praat 和名为 Parselmouth 的 python 库来获取音频文件(.wav)中女性声音的基本频率值。但是,我得到了一些超过 255Hz 的值(例如:400+Hz、500Hz)。获得这样的大值是否正常?

4

1 回答 1

3

如果您试图捕捉说话声音的基频 (F0),这是可能的,但不太可能。听起来您可能正在捕捉更容易产生共鸣的泛音(例如 F1 或 F2)。

我对 Praat 的实验给我的印象是,如果具有良好的参数,它将可靠地提取 F0。

您要做的是通过将音高曲线与频谱图进行比较来验证这一点。以下是 Praat(女发言人)制作的配件示例:

频谱图和 F0

从图中可以看出

  • 最突出的频率似乎是 F2
  • 大约 200 Hz 似乎可能是 F0,因为只有低于该频率的噪音(与该段之前/之后相比)
  • Praat 为浊音段计算了一个很好的 F0 估计值

如果在目视检查之后,您似乎得到了错误的结果,您可以尝试调整参数。窗口长度极大地影响频率分辨率。

如果你不能捕捉到这么低的频率,你应该尝试增加窗口长度——直觉是它让算法有更好的机会在数据中找到缓慢变化的周期性特征。

于 2018-12-15T10:34:57.353 回答