我已阅读以下问题:这里
我正在尝试做的是获取一个信号(.wav 音频文件),其中包含来自不同蝙蝠物种的呼叫。这是信号的图形表示:
到目前为止我所做的是:
1)强调信号
2) 压缩信号
这是我绘制的输出:
我需要删除不值得考虑的信号。目前,信号是一维表示,在分离完成后,信号将是一个仅包含调用的 2D 表示,因此我可以对每个调用进行分析。
这是我建议的方法:
1) 将信号拆分为:256x100 的块(因此它们重叠)
2)计算每个块的RMS(均方根)
3) 将 (2) 与阈值进行比较,如果该区块值得考虑,则可以将其归类为看涨期权。
但问题是这样的:
1) 将信号分成 256x100 的块是否会覆盖呼叫,从而在计算 RMS 时使一些呼叫丢失?
2)因此,我如何选择合适的阈值?找到信号中的峰值会是一个准确的假设吗?
我希望有一个人可以帮助我 :)