我正在尝试测量开始音(3800Hz)和结束音(高幅度但频率未知)之间的持续时间(以样本为单位)。这两种音调随机分布在一个 .wav 文件中(预计 10 秒)。识别第一个音的最后一个样本和最后一个音的第一个样本的样本号是否重要?我怎样才能做到这一点?
.wav 文件包含基频和一些噪声(以及开始音和结束音)。我预先录制了带有基频和背景噪声的起始音,我可以使用相关函数来检测它吗?
一些噪声(瞬间)超过 3800Hz,因此使用阈值检测音调的方法效果不佳。但是,我是否可以使用音调事件的持续时间比任何噪声事件更长的事实(因为它是通过按下和释放按钮故意产生的)来检测音调。