我正在开发一个应用程序,我需要为语音识别实现梅尔频率倒谱系数 (MFCC)。
MFCC 的第一步是应用 Pre-Emphasis
预加重将增加更高频率的信号能量。因为低频段被对语音识别无用/有害的声音占据。
我为这个过程找到了这个方程:
Y[n]=X[n]−0.95⋅X[n−1]
我的问题是我应该简单地将这个方程应用于原始信号吗?这样它会增加更高频率的信号能量。或者我应该在应用这个方程之前对输入信号应用某个滤波器?如果是这样,我将如何编程?
我正在开发一个应用程序,我需要为语音识别实现梅尔频率倒谱系数 (MFCC)。
MFCC 的第一步是应用 Pre-Emphasis
预加重将增加更高频率的信号能量。因为低频段被对语音识别无用/有害的声音占据。
我为这个过程找到了这个方程:
Y[n]=X[n]−0.95⋅X[n−1]
我的问题是我应该简单地将这个方程应用于原始信号吗?这样它会增加更高频率的信号能量。或者我应该在应用这个方程之前对输入信号应用某个滤波器?如果是这样,我将如何编程?