0

我正在与 MFCC 合作开展一个关于语音识别的项目。根据本网站http://practicalcryptography.com/miscellaneous/machine-learning/guide-mel-frequency-cepstral-coefficients-mfccs/中的文档,Mel-filterbank 的计算公式如下:

`H (k, m) = 0 if ( k < f[m-1] )   
          = (k - f(m-1)) / (f[m] - f[m-1]) if ( f[m-1] <= k <= f[m] )
          = (f[m+1] - k) / (f[m+1] - f[m]) if ( f[m] <= k <= f[m+1] )
          = 0 if ( k > f[m+1] )`

我认为这里出了点问题。什么是“k”?这个网站不是唯一的。我搜索了很多文件,但它仍然存在。此外,如果 m == 1 , f[0] 不计算,所以条件( k < f[m-1] )是错误的,不是吗?有谁能够帮我?

4

1 回答 1

1

您正在定义一个H接受形式参数的函数,k并且m. 这就是 k 的定义方式。f[0]定义得很好。

基本上,该公式描述了这种形式___/\___,其峰值为k=f[m]

于 2013-07-07T23:22:37.147 回答