我正在使用parselmouth(praat 周围的包装器)通过这样做来提取强度和音高特征:
snd = parselmouth.Sound(path)
intensity = snd.to_intensity()
pitch = snd.to_pitch()
但是,音频文件包含长序列的静音,我想在计算这些音频指标之前将其删除。我可以通过处理通过 wave 包读取音频(并应用一些逻辑)返回的 numpy 数组来消除静音,但无法将新数组传递给 parselmouth。
我什至愿意为 parselmouth 提供 startTime 和 endTime 参数,但也找不到支持该参数的文档。